偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<pre id="6ioed"><b id="6ioed"></b></pre>

<thead id="6ioed"><acronym id="6ioed"></acronym></thead>

<abbr id="6ioed"></abbr>

<nav id="6ioed"><menu id="6ioed"></menu></nav>

<nobr id="6ioed"></nobr>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

揭秘 RAG：為什么說它是讓大語言模型（LLM）更聰明的秘密武器？

作者：用戶007 2025-04-25 10:03:12

簡單來說，RAG 就是給聰明但可能信息滯后或“愛瞎猜”的大語言模型(LLM)配上了一個強大的外部搜索引擎和資料庫。

現(xiàn)在人工智能（AI）很火，尤其是像 ChatGPT 這樣的大語言模型（LLM），它們能聊天、寫文章、寫代碼，感覺無所不能。但有時候，它們也會犯一些小錯誤，比如信息過時了，或者一本正經(jīng)地胡說八道（這叫“幻覺”），或者你問它一些你們公司內(nèi)部的事情，它就完全不知道了。

為了解決這些問題，科學(xué)家們想出了一個聰明的辦法，叫做RAG。

一、咱們先聊聊，為啥需要RAG？

想象一下，現(xiàn)在的大語言模型就像一個超級聰明的學(xué)生，讀了很多很多的書（訓(xùn)練數(shù)據(jù)），知識儲備非常豐富。但是：

知識有“保質(zhì)期”：它學(xué)習(xí)的知識是截止到某個時間點的。比如，你問它昨天發(fā)生的新聞，或者最新的科技進展，它可能就不知道了，因為它“畢業(yè)”之后就沒再學(xué)新東西。
可能會“瞎編”：有時候遇到它不太確定的問題，為了不冷場，它可能會根據(jù)自己學(xué)過的知識，“推測”或“編造”一個看起來很像真的答案。這就是所謂的“幻覺”。
不知道“內(nèi)部信息”：你公司的內(nèi)部規(guī)章制度、項目資料、最新的銷售數(shù)據(jù)等等，這些沒有公開在網(wǎng)上的信息，它肯定不知道。

RAG 技術(shù)就是為了解決這些痛點而生的。

二、那RAG到底是個啥玩意兒？

RAG 的英文全稱是 Retrieval-Augmented Generation，中文可以叫做 “檢索增強生成”。

咱們把它拆開看：

Retrieval (檢索)：就像我們遇到不知道的問題，會去搜索引擎（比如百度、谷歌）或者翻書查找資料一樣，這一步就是讓 AI 去一個外部的知識庫里把相關(guān)的、最新的信息找出來。
Augmented (增強)：就是把找到的這些信息，補充給那個聰明的 AI。
Generation (生成)：最后，AI 結(jié)合它自己本來就知道的知識和剛剛從外部找到的新信息，生成一個更靠譜、更準(zhǔn)確、更新的答案給你。

簡單打個比方：

沒有 RAG 的 AI，就像一個只靠記憶答題的學(xué)生，雖然博學(xué)，但信息可能過時，也可能記錯。
有了 RAG 的 AI，就像一個開卷考試的學(xué)生！在回答問題前，它被允許先去查閱指定的最新資料（檢索），然后結(jié)合自己學(xué)過的知識和查到的資料，寫出答案（增強生成）。這樣一來，答案自然就更準(zhǔn)確、更與時俱進了。

三、RAG是咋工作的？原理大揭秘

RAG 的工作流程其實挺符合咱們解決問題的直覺，主要分三步：

第一步：搞明白你想問啥（問題處理）

當(dāng)你向 RAG 系統(tǒng)提問時（比如輸入：“我們公司最新的報銷政策是什么？”），系統(tǒng)首先會分析你的問題，理解你到底想知道什么。有時候它還會稍微改寫一下你的問題，讓后面的搜索更有效率。

第二步：大海撈針找資料（信息檢索）

這是 RAG 的核心之一。系統(tǒng)會拿著你的問題（或者處理過的問題），去一個指定的知識庫里搜索相關(guān)信息。

(1) 知識庫是啥？這個知識庫可不是 AI 原來訓(xùn)練時的那個“大腦”，而是外部掛載的。它可以是：

互聯(lián)網(wǎng)上的海量網(wǎng)頁（像搜索引擎一樣）
一個公司內(nèi)部的文件集合（比如 Word 文檔、PDF、數(shù)據(jù)庫）
某個特定領(lǐng)域的專業(yè)文獻庫（比如醫(yī)學(xué)、法律）

(2) 怎么找？它不是簡單地做關(guān)鍵詞匹配。通常，系統(tǒng)會把你的問題和知識庫里的文檔都轉(zhuǎn)換成一種叫做“向量”（Vector Embeddings）的數(shù)學(xué)表示。這種表示能捕捉語義信息（意思）。然后，系統(tǒng)會計算你的問題向量和知識庫里每個文檔（或文檔片段）向量的相似度，找出那些在意思上最接近你問題的文檔片段。就好比，它要找的不是字面完全一樣的內(nèi)容，而是談?wù)撏粋€話題的內(nèi)容。

(3) 找到啥？它會挑出幾個最相關(guān)的文檔片段（Chunks），作為回答問題的“參考資料”。

第三步：結(jié)合信息，聰明作答（增強生成）

這是 RAG 的另一半核心?，F(xiàn)在，系統(tǒng)把兩樣?xùn)|西一起交給那個聰明的大語言模型（LLM）：

你最初的問題。
第二步找到的相關(guān)信息片段（就是那些“參考資料”）。

然后，系統(tǒng)會給 LLM 一個指令，大概意思是：“嘿，根據(jù)你自己的知識，并重點參考我給你的這些資料，回答用戶的問題?！?/p>

LLM 就像拿到“開卷考試”的“小抄”一樣，它會閱讀這些新鮮、具體的資料，然后結(jié)合自己強大的語言理解和生成能力，生成一個既流暢自然，又信息準(zhǔn)確、基于事實的答案。

這個最終答案，就因為它結(jié)合了外部檢索到的最新或特定信息，所以比單純靠 LLM “回憶”出來的答案要靠譜得多。

四、RAG有啥好處？為啥這么火？

答案更準(zhǔn)確、更新：能利用最新的外部信息，解決了 LLM 知識陳舊的問題。
減少胡說八道：因為答案是基于檢索到的事實生成的，大大降低了 AI “幻覺”的概率。
知識可定制：可以接入特定領(lǐng)域的知識庫（比如公司內(nèi)部文檔、行業(yè)報告），讓 AI 變成某個領(lǐng)域的“專家”。
可溯源：很多 RAG 系統(tǒng)能告訴你答案是參考了哪些文檔生成的，方便你核實信息來源。
成本效益高：相比于用新數(shù)據(jù)從頭重新訓(xùn)練一個巨大的 LLM 模型（非常昂貴且耗時），只更新外部知識庫要便宜和快捷得多。

五、RAG有沒有缺點或挑戰(zhàn)？

當(dāng)然，RAG 也不是完美的：

檢索質(zhì)量是關(guān)鍵：如果第一步“找資料”沒找對，或者找到的是錯誤信息，那么最終的答案也可能出錯（垃圾進，垃圾出）。如何提高檢索的精準(zhǔn)度是個挑戰(zhàn)。
整合可能不順暢：有時候，LLM 可能沒完全理解或者沒很好地利用檢索到的信息，導(dǎo)致答案有點生硬或者沒有完全回答問題。
速度問題：因為多了“檢索”這一步，RAG 系統(tǒng)回答問題通常會比純 LLM 慢一點點。
系統(tǒng)復(fù)雜性：搭建一個高效的 RAG 系統(tǒng)，需要處理好檢索、生成兩個環(huán)節(jié)的協(xié)同，技術(shù)上有一定復(fù)雜度。

六、舉個栗子，感受一下

假設(shè)你問一個聊天機器人：“給我總結(jié)一下咱們項目組上周的會議紀(jì)要?！?/p>

(1) 沒有 RAG 的機器人：很可能會說：“對不起，我沒有訪問你們項目組會議紀(jì)要的權(quán)限?！?或者根據(jù)網(wǎng)上找到的通用會議紀(jì)要模板瞎編一個。

(2) 有 RAG 的機器人（接入了公司內(nèi)部文檔系統(tǒng)）：

它會去公司的文檔系統(tǒng)里檢索“項目組上周會議紀(jì)要”。
找到相關(guān)的會議紀(jì)要文檔。
把找到的紀(jì)要內(nèi)容喂給 LLM。
LLM閱讀紀(jì)要，并生成一個簡潔的總結(jié)給你。

看，這樣是不是就實用多了？

七、總結(jié)一下

簡單來說，RAG 就是給聰明但可能信息滯后或“愛瞎猜”的大語言模型(LLM)配上了一個強大的外部搜索引擎和資料庫。

RAG = 智能檢索 (找對、找全資料) + 智能生成 (用好資料、說人話)

它讓 AI 在回答問題前，先做“功課”(檢索)，再結(jié)合“功課”和自己的知識來回答，使得答案更準(zhǔn)確、更可靠、更與時俱進，還能利用私有或特定領(lǐng)域的知識。這使得 AI 在很多實際應(yīng)用場景中變得更加強大和值得信賴。

責(zé)任編輯：趙寧寧來源： Python數(shù)智工坊

RAG 大語言模型 LLM 人工智能

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<samp id="mtx19"><b id="mtx19"></b></samp>

<samp id="mtx19"></samp>

<samp id="mtx19"></samp>