最新突破!Agentic RAG 的七種企業(yè)架構(gòu)
今天,分享一篇長(zhǎng)達(dá) 35 頁(yè)的最新Agentic RAG 綜述。
論文想解決的核心問(wèn)題是,當(dāng)今天大型語(yǔ)言模型(LLMs)在處理動(dòng)態(tài)、實(shí)時(shí)查詢時(shí)依賴靜態(tài)訓(xùn)練數(shù)據(jù)導(dǎo)致的過(guò)時(shí)、不準(zhǔn)確輸出、幻覺等問(wèn)題。
它從最基本原則和 RAG 范式的演變開始,介紹 Agentic RAG 的 7 種架構(gòu)。還重點(diǎn)介紹在 5 種應(yīng)用場(chǎng)景的效果,如醫(yī)療保健、金融和教育等行業(yè)中的關(guān)鍵應(yīng)用,且非常詳細(xì)。
Agentic RAG 原理
首先,來(lái)看 Agentic RAG 是如何破局傳統(tǒng)的限制,成為新的探索方向呢。
一般來(lái)說(shuō),普通常 Agent 包括 4 部分組成:
- LLM(具有定義的角色和任務(wù)):作為 Agent 主要推理引擎,幫助用戶查詢,生成響應(yīng),并保持連貫性。
- 記憶(短長(zhǎng)期記憶):在互動(dòng)過(guò)程中的上下文和依賴數(shù)據(jù),短期記憶會(huì)跟蹤對(duì)話狀態(tài),而長(zhǎng)期記憶具備長(zhǎng)期存儲(chǔ)數(shù)據(jù)能力。
- 規(guī)劃(反思與自我評(píng)價(jià)):可以通過(guò)自我反思和自我評(píng)判引導(dǎo) Agent 的迭代推理。
- 工具(如向量搜索、網(wǎng)絡(luò)搜索、API 等):僅靠上面三個(gè)部分 Agent 還是過(guò)于簡(jiǎn)單,通過(guò)工具擴(kuò)展來(lái)提高 Agent 能力,如調(diào)用外部資源,實(shí)時(shí)獲取數(shù)據(jù)等。
然后,Agentic RAG 帶來(lái)了新的 4 種機(jī)制。
1. 自我反思
通過(guò)對(duì)其輸出的正確性、風(fēng)格、效率進(jìn)行批判,不斷驗(yàn)證結(jié)果差距來(lái)進(jìn)一步增強(qiáng)。像人類一樣具備自我修煉、評(píng)估檢索到的結(jié)果進(jìn)行迭代改進(jìn)。
2. 規(guī)劃
規(guī)劃?rùn)C(jī)制,它能夠通過(guò)分解復(fù)雜任務(wù)為子任務(wù)并動(dòng)態(tài)調(diào)整執(zhí)行順序,適應(yīng)動(dòng)態(tài)環(huán)境,處理不確定任務(wù),推動(dòng)創(chuàng)新應(yīng)用。具備這種能力,在動(dòng)態(tài)和不確定的場(chǎng)景中進(jìn)行多跳推理和迭代問(wèn)題解決至關(guān)重要。
3. 工具使用
工具可以擴(kuò)展 Agent 能力的變?yōu)橹陵P(guān)重要,讓Agent 系統(tǒng)變得更靈活,能力更強(qiáng)。
4. 多 Agent 協(xié)作
意思是多個(gè)不同 Agent 在一起協(xié)同作業(yè),分工明確每個(gè) Agent 負(fù)責(zé)具體任務(wù)。類似在企業(yè)團(tuán)隊(duì)共同合作完成任務(wù),這些效率高效。
Agentic RAG七種框架
1. 單Agent架構(gòu)
單 Agent 架構(gòu)在處理簡(jiǎn)單任務(wù)時(shí)表現(xiàn)出色,但在處理復(fù)雜任務(wù)時(shí)效率較低。其優(yōu)勢(shì)在于簡(jiǎn)單的設(shè)計(jì)和高效的資源優(yōu)化,這種架構(gòu)強(qiáng)調(diào)簡(jiǎn)單,輕松的任務(wù)。
案例:客戶支持
2. 多Agent架構(gòu)
多Agent 架構(gòu)在處理復(fù)雜任務(wù)時(shí)表現(xiàn)優(yōu)異,能夠并行處理多種查詢類型,提高系統(tǒng)的可擴(kuò)展性和準(zhǔn)確性。這種架構(gòu)難點(diǎn)在于,你要如何挑戰(zhàn)在多個(gè) Agent 間的協(xié)調(diào)復(fù)雜性和計(jì)算開銷。
案例:多領(lǐng)域研究助手
3. 分層代理架構(gòu)
分Agent 架構(gòu),適合較為復(fù)雜的多面查詢場(chǎng)景表現(xiàn)最佳,通過(guò)優(yōu)先級(jí)分配,提高了整體響應(yīng)的準(zhǔn)確性和連貫性。比較有挑戰(zhàn)地方,如何維護(hù)多級(jí)代理間的通信和資源分配。
案例:金融分析系統(tǒng)
4. 自我糾正架構(gòu)
核心思想是通過(guò)動(dòng)態(tài)評(píng)估檢索文檔的相關(guān)性并進(jìn)行修正,從而提高響應(yīng)的準(zhǔn)確性和相關(guān)性。
案例:學(xué)術(shù)研究助手 提示:生成式AI研究的最新發(fā)現(xiàn)有哪些? 綜合響應(yīng):“生成式AI的最新發(fā)現(xiàn)突顯了擴(kuò)散模型的進(jìn)步、用于文本到視頻任務(wù)的強(qiáng)化學(xué)習(xí)以及大規(guī)模模型訓(xùn)練的優(yōu)化技術(shù)。欲了解更多細(xì)節(jié),請(qǐng)參閱2024年NeurIPS和2025年AAAI發(fā)表的研究?!?/p>
5. 自適應(yīng)架構(gòu)
非常核心的理念是,它可以根據(jù)查詢的復(fù)雜性動(dòng)態(tài)調(diào)整檢索策略的能力。
6. 圖RAG的Agent 框架
核心原理,它可以動(dòng)態(tài)分配檢索任務(wù)給專門代理的能力,利用圖形知識(shí)庫(kù)和文本文檔。是一種比較新穎的Agent 架構(gòu),可以將圖知識(shí)庫(kù)與非結(jié)構(gòu)化文檔檢索相結(jié)合。從而增強(qiáng)了檢索增強(qiáng)生成(RAG)系統(tǒng),提高了推理和檢索的準(zhǔn)確性。
GeAR概覽,用于檢索增強(qiáng)生成的圖增強(qiáng)Agent。
7. 企業(yè)級(jí)架構(gòu)
提供了企業(yè)級(jí)應(yīng)用的相對(duì)完整解決方案,企業(yè)比較典型場(chǎng)景“發(fā)票支付工作流”。
Agentic RAG 實(shí)際應(yīng)用場(chǎng)景,成功案例
下面是,Agentic RAG 系統(tǒng)在實(shí)際應(yīng)用中的成功案例,也展示了 Agentic RAG的優(yōu)勢(shì)所在。
- Twitch利用Agentic RAG系統(tǒng)優(yōu)化廣告銷售流程
- 醫(yī)療機(jī)構(gòu)使用Agentic RAG系統(tǒng)生成患者病例摘要
- 法律機(jī)構(gòu)使用Agentic RAG系統(tǒng)進(jìn)行合同審查
- 保險(xiǎn)公司使用Agentic RAG系統(tǒng)自動(dòng)化汽車保險(xiǎn)理賠處理
- 高等教育機(jī)構(gòu)使用Agentic RAG系統(tǒng)輔助研究人員生成研究論文摘要
好了,以上是這篇 35 頁(yè)綜述。