RAG范式演進及Agentic-RAG總結(jié)綜述 原創(chuàng)
RAG的核心思想是通過實時數(shù)據(jù)檢索彌補這一缺陷——在生成答案前,系統(tǒng)先從外部數(shù)據(jù)源(如數(shù)據(jù)庫、API或互聯(lián)網(wǎng))動態(tài)檢索相關(guān)上下文,再結(jié)合LLM的知識生成更精準、實時的響應(yīng)。但它們通常在處理動態(tài)、多步推理任務(wù)、適應(yīng)性和復(fù)雜工作流的協(xié)調(diào)方面仍然存在不足。
rag三大組件
- 檢索器(Retriever):從外部數(shù)據(jù)源(如向量數(shù)據(jù)庫、知識圖譜或網(wǎng)頁)中搜索與查詢相關(guān)的信息。相關(guān)技術(shù):如BM25關(guān)鍵詞匹配、密集向量搜索等。
- 增強器(Augmenter):對檢索結(jié)果進行篩選、排序和整合,提取最相關(guān)的片段。相關(guān)技術(shù):上下文重排序、多跳檢索。
- 生成器(Generator):將增強后的上下文與LLM的預(yù)訓(xùn)練知識結(jié)合,生成自然語言回答。確?;卮疬B貫且忠實于檢索內(nèi)容,避免出現(xiàn)幻覺。
RAG范式演進
RAG范式的對比
Naive RAG:基礎(chǔ)實現(xiàn)
Naive RAG是RAG范式的最初實現(xiàn),其核心思想是通過簡單的關(guān)鍵詞檢索來增強生成模型的能力。這種方法依賴于TF-IDF、BM25等傳統(tǒng)的檢索技術(shù),從靜態(tài)數(shù)據(jù)集中獲取文檔,并將其用于生成模型的輸入。
優(yōu)點:
- 簡單易實現(xiàn):由于依賴簡單的關(guān)鍵詞匹配,Naive RAG易于實現(xiàn)。
- 快速部署:適合需要快速上線的場景。
缺點:
- 缺乏上下文感知:由于僅依賴詞匯匹配,無法捕捉查詢的語義細微差別。
- 輸出碎片化:生成的響應(yīng)可能不連貫或過于通用。
- 可擴展性問題:在處理大規(guī)模數(shù)據(jù)集時表現(xiàn)不佳。
Advanced RAG:語義增強
為了克服Naive RAG的局限性,Advanced RAG引入了語義理解和增強的檢索技術(shù)。Advanced RAG使用密集向量搜索模型(如Dense Passage Retrieval, DPR)和神經(jīng)排序算法來提高檢索的精確度。
關(guān)鍵特性:
- 密集向量搜索:通過將查詢和文檔表示在高維向量空間中,實現(xiàn)更好的語義對齊。
- 上下文重排:使用神經(jīng)模型重新排序檢索到的文檔,優(yōu)先考慮最相關(guān)的信息。
- 多跳檢索:支持跨多個文檔的推理,適用于復(fù)雜查詢。
適用場景:
- 高精度需求:如研究綜合和個人化推薦。
Modular RAG:模塊化設(shè)計
Modular RAG代表了RAG范式的最新發(fā)展,強調(diào)靈活性和定制化。這種系統(tǒng)將檢索和生成管道分解為獨立的、可重用的組件,允許針對特定領(lǐng)域進行優(yōu)化和任務(wù)適應(yīng)。
創(chuàng)新點:
- 混合檢索策略:結(jié)合稀疏和密集檢索方法,以最大化不同查詢類型的準確性。
- 工具集成:可以集成外部API、數(shù)據(jù)庫或計算工具來處理專門任務(wù)。
- 可組合管道:允許獨立替換、增強或重新配置檢索器、生成器和其他組件。
適用場景:
- 復(fù)雜多領(lǐng)域任務(wù):如金融分析和個性化推薦。
Graph RAG:圖結(jié)構(gòu)整合
Graph RAG通過整合圖結(jié)構(gòu)數(shù)據(jù)來擴展傳統(tǒng)的RAG系統(tǒng)。這些系統(tǒng)利用圖數(shù)據(jù)中的關(guān)系和層次結(jié)構(gòu)來增強多跳推理和上下文豐富。
特點:
- 節(jié)點連接性:捕捉實體之間的關(guān)系。
- 層次知識管理:通過圖結(jié)構(gòu)處理結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
- 上下文豐富:通過圖路徑增加關(guān)系理解。
適用場景:
- 結(jié)構(gòu)化數(shù)據(jù)任務(wù):如醫(yī)療診斷和法律研究。
Agentic RAG:自主代理
Agentic RAG代表了一種范式轉(zhuǎn)變,通過引入能夠動態(tài)決策和優(yōu)化工作流的自主代理來實現(xiàn)更高層次的靈活性和適應(yīng)性。與靜態(tài)系統(tǒng)不同,Agentic RAG采用迭代細化和自適應(yīng)檢索策略來處理復(fù)雜的實時和多領(lǐng)域查詢。
關(guān)鍵特性:
- 自主決策:代理根據(jù)查詢復(fù)雜性獨立評估和管理檢索策略。
- 迭代細化:通過反饋循環(huán)提高檢索準確性和響應(yīng)相關(guān)性。
- 工作流優(yōu)化:動態(tài)協(xié)調(diào)任務(wù),提高實時應(yīng)用的效率。
適用場景:
- 動態(tài)適應(yīng)性強:如客戶支持和財務(wù)分析。
Agentic RAG
Agentic RAG概覽
一、Agentic RAG的核心模式
- 反思
- 定義:智能體評估自己的決策和輸出,識別錯誤和需要改進的領(lǐng)域。
- 主要優(yōu)勢:
a.啟用迭代結(jié)果改進。
b.提高多步推理任務(wù)的準確性。
- 示例:在醫(yī)療診斷系統(tǒng)中,智能體根據(jù)檢索到的數(shù)據(jù)進行迭代反饋,以完善診斷。
反思模式
2. 規(guī)劃
- 定義:智能體創(chuàng)建結(jié)構(gòu)化的工作流和任務(wù)序列,以高效解決問題。
- 主要優(yōu)勢:
a.通過分解任務(wù),促進多步推理。
b.通過優(yōu)化任務(wù)優(yōu)先級,減少計算開銷。
- 示例:金融分析系統(tǒng)規(guī)劃數(shù)據(jù)檢索任務(wù),以評估風(fēng)險并提供建議。
規(guī)劃模式
3. 工具使用
- 定義:智能體與外部工具、API和知識庫交互,以檢索和處理數(shù)據(jù)。
- 主要優(yōu)勢:
a.擴展系統(tǒng)的能力,超越預(yù)訓(xùn)練知識。
b.通過整合外部資源,實現(xiàn)特定領(lǐng)域的應(yīng)用。
- 示例:法律助理智能體從合同數(shù)據(jù)庫中檢索條款,并應(yīng)用特定領(lǐng)域的規(guī)則進行合規(guī)性分析。
工具使用模式
4. 多智能體協(xié)作
- 定義:多個智能體協(xié)作,通過分工和共享信息及結(jié)果來解決復(fù)雜任務(wù)。
- 主要優(yōu)勢:
a.高效處理大規(guī)模和分布式問題。
b.結(jié)合專業(yè)智能體的能力,獲得更好的結(jié)果。
- 示例: 在客戶支持中,智能體協(xié)作以從常見問題解答(FAQ)中檢索知識、生成響應(yīng)并提供后續(xù)服務(wù)。 LawGlance通過利用多智能體工作流簡化法律研究,檢索相關(guān)文件,分析信息,并提供精確的法律見解。它整合了Crew AI、LangChain和Chroma,以檢索法律文件、進行網(wǎng)絡(luò)搜索,并提供針對用戶查詢的簡潔、準確的答案。
多智能體協(xié)作模式
小結(jié):這些模式構(gòu)成了Agentic RAG系統(tǒng)的核心,使它們能夠動態(tài)適應(yīng)任務(wù)需求,通過自我評估改進決策,利用外部資源進行特定領(lǐng)域的推理,通過協(xié)作處理復(fù)雜、分布式的工作流。
二、Agentic RAG系統(tǒng)的分類
Agentic檢索增強型生成(RAG)系統(tǒng)涵蓋了各種架構(gòu)和工作流,每種都針對特定任務(wù)和復(fù)雜程度進行了定制。
1. 單智能體RAG
- 核心思想:由單個自主智能體管理檢索和生成過程。
- 工作流程:
- 向智能體提交查詢。
- 智能體從外部來源檢索相關(guān)數(shù)據(jù)。
- 對數(shù)據(jù)進行處理并合成回復(fù)。
- 優(yōu)點:
- 對于基本用例,架構(gòu)簡單。
- 易于實現(xiàn)和維護。
- 局限性:
- 可擴展性有限。
- 對于多步推理或大型數(shù)據(jù)集效果不佳。
2. 多智能體RAG
- 核心思想:一組智能體協(xié)作執(zhí)行復(fù)雜的檢索和推理任務(wù)。
- 工作流程:
- 智能體動態(tài)劃分任務(wù)(例如,檢索、推理、合成)。
- 每個智能體專門負責(zé)特定的子任務(wù)。
- 將結(jié)果匯總并合成為連貫的輸出。
- 優(yōu)點:
- 對于分布式、多步任務(wù)表現(xiàn)更佳。
- 模塊化程度更高,可擴展性更強。
- 局限性:
- 隨著智能體數(shù)量的增加,協(xié)調(diào)復(fù)雜度上升。
- 智能體之間存在冗余或沖突的風(fēng)險。
3. 分層智能體RAG
- 核心思想:將智能體組織成層次結(jié)構(gòu),以便更好地進行任務(wù)優(yōu)先級排序和委派。
- 工作流程:
- 頂層智能體在較低層級智能體之間協(xié)調(diào)子任務(wù)。
- 每個較低層級智能體處理流程中的特定部分。
- 結(jié)果在較高層級迭代優(yōu)化并整合。
- 優(yōu)點:
- 對于大型復(fù)雜任務(wù)具有可擴展性。
- 模塊化設(shè)計便于實現(xiàn)專業(yè)化。
- 局限性:
- 需要復(fù)雜的協(xié)調(diào)機制。
- 在層級結(jié)構(gòu)的較高層級可能出現(xiàn)瓶頸。
4. 糾錯智能體RAG
- 核心思想:通過反饋循環(huán)使智能體能夠迭代評估和優(yōu)化其輸出。
- 工作流程:
- 智能體生成初始回復(fù)。
- 一個評判模塊評估回復(fù)是否存在錯誤或不一致之處。
- 智能體根據(jù)反饋優(yōu)化回復(fù)。
- 重復(fù)步驟2 - 3,直到輸出達到質(zhì)量標準。
- 優(yōu)點:
- 通過迭代改進實現(xiàn)高準確性和可靠性。
- 對于容易出錯或高風(fēng)險任務(wù)很有用。
- 局限性:
- 計算開銷增加。
- 反饋機制必須精心設(shè)計,以避免無限循環(huán)。
5. 自適應(yīng)智能體RAG
- 核心思想:根據(jù)任務(wù)要求動態(tài)調(diào)整檢索策略和工作流程。
- 工作流程:
- 智能體評估查詢及其上下文。
- 根據(jù)可用數(shù)據(jù)和用戶需求實時調(diào)整檢索策略。
- 使用動態(tài)工作流程合成回復(fù)。
- 優(yōu)點:
- 對于各種任務(wù)和動態(tài)環(huán)境具有高度靈活性。
- 提高上下文相關(guān)性和用戶滿意度。
- 局限性:
- 設(shè)計強大的自適應(yīng)機制具有挑戰(zhàn)性。
- 實時調(diào)整會帶來計算開銷。
6. 基于圖的智能體RAG
基于圖的RAG系統(tǒng)通過整合基于圖的數(shù)據(jù)結(jié)構(gòu)進行高級推理,擴展了傳統(tǒng)的RAG。
6.1 Agent - G:用于圖RAG的智能體框架
- 核心思想:使用圖知識庫和反饋循環(huán),動態(tài)地將任務(wù)分配給專門的智能體。
- 工作流程:
- 從圖知識庫中提取關(guān)系(例如,疾病與癥狀的映射)。
- 用來自外部來源的非結(jié)構(gòu)化數(shù)據(jù)進行補充。
- 使用評判模塊驗證結(jié)果并迭代改進。
- 優(yōu)點:
- 結(jié)合了結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
- 對于復(fù)雜任務(wù)具有模塊化和可擴展性。
- 通過迭代優(yōu)化確保高準確性。
6.2 GeAR:用于RAG的圖增強智能體
- 核心思想:通過圖擴展技術(shù)和基于智能體的架構(gòu)增強RAG系統(tǒng)。
- 工作流程:
- 擴展與查詢相關(guān)的圖,以更好地理解關(guān)系。
- 利用專門的智能體進行多跳推理。
- 將圖結(jié)構(gòu)和非結(jié)構(gòu)化信息合成為回復(fù)。
- 優(yōu)點:
- 在多跳推理場景中表現(xiàn)出色。
- 提高深度上下文任務(wù)的準確性。
- 能夠動態(tài)適應(yīng)復(fù)雜的查詢環(huán)境。
7. 智能體文檔工作流(ADW)
智能體文檔工作流(ADW)通過利用智能體自動化以文檔為中心的流程,對傳統(tǒng)的檢索增強生成(RAG)系統(tǒng)進行了擴展。
工作流程
- 文檔解析與結(jié)構(gòu)化:
從諸如發(fā)票或合同等文檔中提取結(jié)構(gòu)化數(shù)據(jù)。
- 狀態(tài)維護:
- 在多步驟工作流中跟蹤上下文,以確保一致性。
- 知識檢索:
- 從外部來源或特定領(lǐng)域的數(shù)據(jù)庫中檢索相關(guān)參考信息。
- 智能體編排:
- 應(yīng)用業(yè)務(wù)規(guī)則,進行多步推理,并協(xié)調(diào)外部應(yīng)用程序編程接口(API)。
- 可執(zhí)行輸出生成:
- 生成針對特定用例定制的結(jié)構(gòu)化輸出(例如,報告或摘要)。
智能體RAG框架的對比分析
傳統(tǒng)RAG、智能體RAG以及智能體文檔工作流(ADW)。該分析突出了它們各自的優(yōu)勢、劣勢及最適用場景,為其在各種不同用例中的適用性提供了寶貴見解。
三種架構(gòu)框架進行了全面的對比分析
關(guān)鍵要點
- 傳統(tǒng)RAG最適合需要基本檢索和生成能力的較簡單任務(wù)。
- 智能體RAG在多智能體協(xié)作推理方面表現(xiàn)出色,適用于更復(fù)雜的多領(lǐng)域任務(wù)。
- 智能體文檔工作流(ADW)為企業(yè)級應(yīng)用(如合同分析和發(fā)票處理)提供定制化的、以文檔為中心的解決方案。
參考文獻:
Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG,https://arxiv.org/abs/2501.09136
本文轉(zhuǎn)載自公眾號大模型自然語言處理 作者:余俊暉
原文鏈接:??https://mp.weixin.qq.com/s/yiHoNn8UH-IQBZN2Ec13qw???
