面試官:聊聊RAG的執(zhí)行流程?
RAG、MCP 和 FunctionCall 等都是 AI 的核心技術(shù),同時也是面試中最長問的知識點,那么今天就來看下:RAG 技術(shù)及其執(zhí)行流程。
概述
RAG(Retrieval-Augmented Generation,檢索增強生成)是指在將原始問題發(fā)送給大語言模型之前,先通過外部知識庫將數(shù)據(jù)進行注入,之后先在知識庫中檢索相關(guān)信息,然后再將檢索結(jié)果和原始問題一起發(fā)送給大模型組織、整理答案的一種技術(shù)手段。
通過這種實現(xiàn)方式,大語言模型可以獲取到特定領(lǐng)域的相關(guān)信息,并能夠利用這些信息進行回復(fù),從而降低了發(fā)生幻覺的可能性。
RAG 優(yōu)勢:
- 提高準(zhǔn)確性:通過引用外部知識庫,減少幻覺現(xiàn)象。
- 實時更新:允許模型訪問最新信息,解決知識局限性問題。
- 經(jīng)濟高效:與重新訓(xùn)練模型相比,降低了更新成本。
執(zhí)行流程
RAG 執(zhí)行流程通常分為以下兩個階段:
1.生成索引階段:這個階段通常包括文檔清理,以及分詞也就是將它們拆分為更小的數(shù)據(jù)塊,并把這些數(shù)據(jù)庫轉(zhuǎn)換成向量,最后存儲在向量數(shù)據(jù)庫的過程。
圖片
2. 檢索階段:使用用戶提出的問題,在向量數(shù)據(jù)庫中檢索查詢的過程。
圖片
整體執(zhí)行流程
圖片
使用場景
RAG 典型使用場景有以下幾個。
1. 企業(yè)級知識問答系統(tǒng)
- 場景:公司內(nèi)部文檔(如 HR 政策、技術(shù)手冊、客戶 FAQ)的智能問答。
- 痛點:傳統(tǒng) LLM 無法訪問非公開數(shù)據(jù),且知識可能過時。
- RAG 作用:實時檢索內(nèi)部知識庫,生成準(zhǔn)確且可溯源的答案。
2.客服與技術(shù)支持
- 場景:電商、SaaS 產(chǎn)品的客戶支持(如訂單狀態(tài)查詢、故障排查)。
- 痛點:需依賴實時數(shù)據(jù)(訂單、庫存)和動態(tài)知識(如促銷規(guī)則)。
- RAG 作用:結(jié)合用戶實時數(shù)據(jù)(如訂單 ID)和知識庫,生成個性化回答。
3.醫(yī)療與法律咨詢
- 場景:輔助醫(yī)生查詢最新診療指南,或律師分析判例庫。
- 痛點:對事實準(zhǔn)確性要求極高,且知識需更新(如新藥品、法律條文)。
- RAG 作用:從權(quán)威數(shù)據(jù)庫(如 PubMed、法律條文庫)檢索證據(jù),減少幻覺。
小結(jié)
RAG 是給大模型“外接”知識庫,讓大模型能夠更加精準(zhǔn)回答問題的一種技術(shù)實現(xiàn)手段。它的執(zhí)行主要分為兩個階段:索引生成階段(知識庫添加到向量數(shù)據(jù)庫的過程),檢索階段(根據(jù)用戶輸入信息在向量數(shù)據(jù)庫查詢結(jié)果的階段),當(dāng)然其中有一些執(zhí)行細節(jié)也需要了解并在面試中回答出來。



























