最新突破!Agentic RAG 的七種企業(yè)架構(gòu)
今天,分享一篇長達(dá) 35 頁的最新Agentic RAG 綜述。
論文想解決的核心問題是,當(dāng)今天大型語言模型(LLMs)在處理動態(tài)、實(shí)時查詢時依賴靜態(tài)訓(xùn)練數(shù)據(jù)導(dǎo)致的過時、不準(zhǔn)確輸出、幻覺等問題。
它從最基本原則和 RAG 范式的演變開始,介紹 Agentic RAG 的 7 種架構(gòu)。還重點(diǎn)介紹在 5 種應(yīng)用場景的效果,如醫(yī)療保健、金融和教育等行業(yè)中的關(guān)鍵應(yīng)用,且非常詳細(xì)。

Agentic RAG 原理
首先,來看 Agentic RAG 是如何破局傳統(tǒng)的限制,成為新的探索方向呢。
一般來說,普通常 Agent 包括 4 部分組成:
- LLM(具有定義的角色和任務(wù)):作為 Agent 主要推理引擎,幫助用戶查詢,生成響應(yīng),并保持連貫性。
- 記憶(短長期記憶):在互動過程中的上下文和依賴數(shù)據(jù),短期記憶會跟蹤對話狀態(tài),而長期記憶具備長期存儲數(shù)據(jù)能力。
- 規(guī)劃(反思與自我評價):可以通過自我反思和自我評判引導(dǎo) Agent 的迭代推理。
- 工具(如向量搜索、網(wǎng)絡(luò)搜索、API 等):僅靠上面三個部分 Agent 還是過于簡單,通過工具擴(kuò)展來提高 Agent 能力,如調(diào)用外部資源,實(shí)時獲取數(shù)據(jù)等。

然后,Agentic RAG 帶來了新的 4 種機(jī)制。
1. 自我反思
通過對其輸出的正確性、風(fēng)格、效率進(jìn)行批判,不斷驗(yàn)證結(jié)果差距來進(jìn)一步增強(qiáng)。像人類一樣具備自我修煉、評估檢索到的結(jié)果進(jìn)行迭代改進(jìn)。

2. 規(guī)劃
規(guī)劃機(jī)制,它能夠通過分解復(fù)雜任務(wù)為子任務(wù)并動態(tài)調(diào)整執(zhí)行順序,適應(yīng)動態(tài)環(huán)境,處理不確定任務(wù),推動創(chuàng)新應(yīng)用。具備這種能力,在動態(tài)和不確定的場景中進(jìn)行多跳推理和迭代問題解決至關(guān)重要。

3. 工具使用
工具可以擴(kuò)展 Agent 能力的變?yōu)橹陵P(guān)重要,讓Agent 系統(tǒng)變得更靈活,能力更強(qiáng)。

4. 多 Agent 協(xié)作
意思是多個不同 Agent 在一起協(xié)同作業(yè),分工明確每個 Agent 負(fù)責(zé)具體任務(wù)。類似在企業(yè)團(tuán)隊共同合作完成任務(wù),這些效率高效。

Agentic RAG七種框架
1. 單Agent架構(gòu)
單 Agent 架構(gòu)在處理簡單任務(wù)時表現(xiàn)出色,但在處理復(fù)雜任務(wù)時效率較低。其優(yōu)勢在于簡單的設(shè)計和高效的資源優(yōu)化,這種架構(gòu)強(qiáng)調(diào)簡單,輕松的任務(wù)。
案例:客戶支持

2. 多Agent架構(gòu)
多Agent 架構(gòu)在處理復(fù)雜任務(wù)時表現(xiàn)優(yōu)異,能夠并行處理多種查詢類型,提高系統(tǒng)的可擴(kuò)展性和準(zhǔn)確性。這種架構(gòu)難點(diǎn)在于,你要如何挑戰(zhàn)在多個 Agent 間的協(xié)調(diào)復(fù)雜性和計算開銷。
案例:多領(lǐng)域研究助手
3. 分層代理架構(gòu)
分Agent 架構(gòu),適合較為復(fù)雜的多面查詢場景表現(xiàn)最佳,通過優(yōu)先級分配,提高了整體響應(yīng)的準(zhǔn)確性和連貫性。比較有挑戰(zhàn)地方,如何維護(hù)多級代理間的通信和資源分配。
案例:金融分析系統(tǒng)

4. 自我糾正架構(gòu)
核心思想是通過動態(tài)評估檢索文檔的相關(guān)性并進(jìn)行修正,從而提高響應(yīng)的準(zhǔn)確性和相關(guān)性。
案例:學(xué)術(shù)研究助手 提示:生成式AI研究的最新發(fā)現(xiàn)有哪些? 綜合響應(yīng):“生成式AI的最新發(fā)現(xiàn)突顯了擴(kuò)散模型的進(jìn)步、用于文本到視頻任務(wù)的強(qiáng)化學(xué)習(xí)以及大規(guī)模模型訓(xùn)練的優(yōu)化技術(shù)。欲了解更多細(xì)節(jié),請參閱2024年NeurIPS和2025年AAAI發(fā)表的研究?!?/p>

5. 自適應(yīng)架構(gòu)
非常核心的理念是,它可以根據(jù)查詢的復(fù)雜性動態(tài)調(diào)整檢索策略的能力。

6. 圖RAG的Agent 框架
核心原理,它可以動態(tài)分配檢索任務(wù)給專門代理的能力,利用圖形知識庫和文本文檔。是一種比較新穎的Agent 架構(gòu),可以將圖知識庫與非結(jié)構(gòu)化文檔檢索相結(jié)合。從而增強(qiáng)了檢索增強(qiáng)生成(RAG)系統(tǒng),提高了推理和檢索的準(zhǔn)確性。

GeAR概覽,用于檢索增強(qiáng)生成的圖增強(qiáng)Agent。

7. 企業(yè)級架構(gòu)
提供了企業(yè)級應(yīng)用的相對完整解決方案,企業(yè)比較典型場景“發(fā)票支付工作流”。

Agentic RAG 實(shí)際應(yīng)用場景,成功案例
下面是,Agentic RAG 系統(tǒng)在實(shí)際應(yīng)用中的成功案例,也展示了 Agentic RAG的優(yōu)勢所在。
- Twitch利用Agentic RAG系統(tǒng)優(yōu)化廣告銷售流程
- 醫(yī)療機(jī)構(gòu)使用Agentic RAG系統(tǒng)生成患者病例摘要
- 法律機(jī)構(gòu)使用Agentic RAG系統(tǒng)進(jìn)行合同審查
- 保險公司使用Agentic RAG系統(tǒng)自動化汽車保險理賠處理
- 高等教育機(jī)構(gòu)使用Agentic RAG系統(tǒng)輔助研究人員生成研究論文摘要
好了,以上是這篇 35 頁綜述。




























