偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

【RAG】RAG范式演進(jìn)及Agentic-RAG總結(jié)綜述

作者：余俊暉 2025-02-06 13:50:06

Naive RAG是RAG范式的最初實(shí)現(xiàn)，其核心思想是通過簡單的關(guān)鍵詞檢索來增強(qiáng)生成模型的能力。這種方法依賴于TF-IDF、BM25等傳統(tǒng)的檢索技術(shù)，從靜態(tài)數(shù)據(jù)集中獲取文檔，并將其用于生成模型的輸入。

RAG的核心思想是通過實(shí)時(shí)數(shù)據(jù)檢索彌補(bǔ)這一缺陷——在生成答案前，系統(tǒng)先從外部數(shù)據(jù)源（如數(shù)據(jù)庫、API或互聯(lián)網(wǎng)）動(dòng)態(tài)檢索相關(guān)上下文，再結(jié)合LLM的知識(shí)生成更精準(zhǔn)、實(shí)時(shí)的響應(yīng)。但它們通常在處理動(dòng)態(tài)、多步推理任務(wù)、適應(yīng)性和復(fù)雜工作流的協(xié)調(diào)方面仍然存在不足。

rag三大組件

檢索器（Retriever）：從外部數(shù)據(jù)源（如向量數(shù)據(jù)庫、知識(shí)圖譜或網(wǎng)頁）中搜索與查詢相關(guān)的信息。相關(guān)技術(shù)：如BM25關(guān)鍵詞匹配、密集向量搜索等。
增強(qiáng)器（Augmenter）:對檢索結(jié)果進(jìn)行篩選、排序和整合，提取最相關(guān)的片段。相關(guān)技術(shù)：上下文重排序、多跳檢索。
生成器（Generator）：將增強(qiáng)后的上下文與LLM的預(yù)訓(xùn)練知識(shí)結(jié)合，生成自然語言回答。確?；卮疬B貫且忠實(shí)于檢索內(nèi)容，避免出現(xiàn)幻覺。

RAG范式演進(jìn)

RAG范式的對比

Naive RAG：基礎(chǔ)實(shí)現(xiàn)

圖片

Naive RAG是RAG范式的最初實(shí)現(xiàn)，其核心思想是通過簡單的關(guān)鍵詞檢索來增強(qiáng)生成模型的能力。這種方法依賴于TF-IDF、BM25等傳統(tǒng)的檢索技術(shù)，從靜態(tài)數(shù)據(jù)集中獲取文檔，并將其用于生成模型的輸入。

優(yōu)點(diǎn)：

簡單易實(shí)現(xiàn)：由于依賴簡單的關(guān)鍵詞匹配，Naive RAG易于實(shí)現(xiàn)。
快速部署：適合需要快速上線的場景。

缺點(diǎn)：

缺乏上下文感知：由于僅依賴詞匯匹配，無法捕捉查詢的語義細(xì)微差別。
輸出碎片化：生成的響應(yīng)可能不連貫或過于通用。
可擴(kuò)展性問題：在處理大規(guī)模數(shù)據(jù)集時(shí)表現(xiàn)不佳。

Advanced RAG：語義增強(qiáng)

圖片

為了克服Naive RAG的局限性，Advanced RAG引入了語義理解和增強(qiáng)的檢索技術(shù)。Advanced RAG使用密集向量搜索模型（如Dense Passage Retrieval, DPR）和神經(jīng)排序算法來提高檢索的精確度。

關(guān)鍵特性：

密集向量搜索：通過將查詢和文檔表示在高維向量空間中，實(shí)現(xiàn)更好的語義對齊。
上下文重排：使用神經(jīng)模型重新排序檢索到的文檔，優(yōu)先考慮最相關(guān)的信息。
多跳檢索：支持跨多個(gè)文檔的推理，適用于復(fù)雜查詢。

適用場景：

高精度需求：如研究綜合和個(gè)人化推薦。

Modular RAG：模塊化設(shè)計(jì)

圖片

Modular RAG代表了RAG范式的最新發(fā)展，強(qiáng)調(diào)靈活性和定制化。這種系統(tǒng)將檢索和生成管道分解為獨(dú)立的、可重用的組件，允許針對特定領(lǐng)域進(jìn)行優(yōu)化和任務(wù)適應(yīng)。

創(chuàng)新點(diǎn)：

混合檢索策略：結(jié)合稀疏和密集檢索方法，以最大化不同查詢類型的準(zhǔn)確性。
工具集成：可以集成外部API、數(shù)據(jù)庫或計(jì)算工具來處理專門任務(wù)。
可組合管道：允許獨(dú)立替換、增強(qiáng)或重新配置檢索器、生成器和其他組件。

適用場景：

復(fù)雜多領(lǐng)域任務(wù)：如金融分析和個(gè)性化推薦。

Graph RAG：圖結(jié)構(gòu)整合

圖片

Graph RAG通過整合圖結(jié)構(gòu)數(shù)據(jù)來擴(kuò)展傳統(tǒng)的RAG系統(tǒng)。這些系統(tǒng)利用圖數(shù)據(jù)中的關(guān)系和層次結(jié)構(gòu)來增強(qiáng)多跳推理和上下文豐富。

特點(diǎn)：

節(jié)點(diǎn)連接性：捕捉實(shí)體之間的關(guān)系。
層次知識(shí)管理：通過圖結(jié)構(gòu)處理結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
上下文豐富：通過圖路徑增加關(guān)系理解。

適用場景：

結(jié)構(gòu)化數(shù)據(jù)任務(wù)：如醫(yī)療診斷和法律研究。

Agentic RAG：自主代理

Agentic RAG代表了一種范式轉(zhuǎn)變，通過引入能夠動(dòng)態(tài)決策和優(yōu)化工作流的自主代理來實(shí)現(xiàn)更高層次的靈活性和適應(yīng)性。與靜態(tài)系統(tǒng)不同，Agentic RAG采用迭代細(xì)化和自適應(yīng)檢索策略來處理復(fù)雜的實(shí)時(shí)和多領(lǐng)域查詢。

關(guān)鍵特性：

自主決策：代理根據(jù)查詢復(fù)雜性獨(dú)立評估和管理檢索策略。
迭代細(xì)化：通過反饋循環(huán)提高檢索準(zhǔn)確性和響應(yīng)相關(guān)性。
工作流優(yōu)化：動(dòng)態(tài)協(xié)調(diào)任務(wù)，提高實(shí)時(shí)應(yīng)用的效率。

適用場景：

動(dòng)態(tài)適應(yīng)性強(qiáng)：如客戶支持和財(cái)務(wù)分析。

Agentic RAG

Agentic RAG概覽

一、Agentic RAG的核心模式

反思

定義：智能體評估自己的決策和輸出，識(shí)別錯(cuò)誤和需要改進(jìn)的領(lǐng)域。
主要優(yōu)勢：

a.啟用迭代結(jié)果改進(jìn)。

b.提高多步推理任務(wù)的準(zhǔn)確性。

示例：在醫(yī)療診斷系統(tǒng)中，智能體根據(jù)檢索到的數(shù)據(jù)進(jìn)行迭代反饋，以完善診斷。

反思模式

2. 規(guī)劃

定義：智能體創(chuàng)建結(jié)構(gòu)化的工作流和任務(wù)序列，以高效解決問題。
主要優(yōu)勢：

a.通過分解任務(wù)，促進(jìn)多步推理。

b.通過優(yōu)化任務(wù)優(yōu)先級，減少計(jì)算開銷。

示例：金融分析系統(tǒng)規(guī)劃數(shù)據(jù)檢索任務(wù)，以評估風(fēng)險(xiǎn)并提供建議。

規(guī)劃模式

3. 工具使用

定義：智能體與外部工具、API和知識(shí)庫交互，以檢索和處理數(shù)據(jù)。
主要優(yōu)勢：

a.擴(kuò)展系統(tǒng)的能力，超越預(yù)訓(xùn)練知識(shí)。

b.通過整合外部資源，實(shí)現(xiàn)特定領(lǐng)域的應(yīng)用。

示例：法律助理智能體從合同數(shù)據(jù)庫中檢索條款，并應(yīng)用特定領(lǐng)域的規(guī)則進(jìn)行合規(guī)性分析。

工具使用模式

4. 多智能體協(xié)作

定義：多個(gè)智能體協(xié)作，通過分工和共享信息及結(jié)果來解決復(fù)雜任務(wù)。
主要優(yōu)勢：

a.高效處理大規(guī)模和分布式問題。

b.結(jié)合專業(yè)智能體的能力，獲得更好的結(jié)果。

示例：在客戶支持中，智能體協(xié)作以從常見問題解答（FAQ）中檢索知識(shí)、生成響應(yīng)并提供后續(xù)服務(wù)。 LawGlance通過利用多智能體工作流簡化法律研究，檢索相關(guān)文件，分析信息，并提供精確的法律見解。它整合了Crew AI、LangChain和Chroma，以檢索法律文件、進(jìn)行網(wǎng)絡(luò)搜索，并提供針對用戶查詢的簡潔、準(zhǔn)確的答案。

多智能體協(xié)作模式

小結(jié)：這些模式構(gòu)成了Agentic RAG系統(tǒng)的核心，使它們能夠動(dòng)態(tài)適應(yīng)任務(wù)需求，通過自我評估改進(jìn)決策，利用外部資源進(jìn)行特定領(lǐng)域的推理，通過協(xié)作處理復(fù)雜、分布式的工作流。

二、Agentic RAG系統(tǒng)的分類

Agentic檢索增強(qiáng)型生成（RAG）系統(tǒng)涵蓋了各種架構(gòu)和工作流，每種都針對特定任務(wù)和復(fù)雜程度進(jìn)行了定制。

1. 單智能體RAG

圖片

核心思想：由單個(gè)自主智能體管理檢索和生成過程。
工作流程：

向智能體提交查詢。
智能體從外部來源檢索相關(guān)數(shù)據(jù)。
對數(shù)據(jù)進(jìn)行處理并合成回復(fù)。

優(yōu)點(diǎn)：
對于基本用例，架構(gòu)簡單。
易于實(shí)現(xiàn)和維護(hù)。
局限性：
可擴(kuò)展性有限。
對于多步推理或大型數(shù)據(jù)集效果不佳。

2. 多智能體RAG

圖片

核心思想：一組智能體協(xié)作執(zhí)行復(fù)雜的檢索和推理任務(wù)。
工作流程：

智能體動(dòng)態(tài)劃分任務(wù)（例如，檢索、推理、合成）。
每個(gè)智能體專門負(fù)責(zé)特定的子任務(wù)。
將結(jié)果匯總并合成為連貫的輸出。

優(yōu)點(diǎn)：
對于分布式、多步任務(wù)表現(xiàn)更佳。
模塊化程度更高，可擴(kuò)展性更強(qiáng)。
局限性：
隨著智能體數(shù)量的增加，協(xié)調(diào)復(fù)雜度上升。
智能體之間存在冗余或沖突的風(fēng)險(xiǎn)。

3. 分層智能體RAG

圖片

核心思想：將智能體組織成層次結(jié)構(gòu)，以便更好地進(jìn)行任務(wù)優(yōu)先級排序和委派。
工作流程：

頂層智能體在較低層級智能體之間協(xié)調(diào)子任務(wù)。
每個(gè)較低層級智能體處理流程中的特定部分。
結(jié)果在較高層級迭代優(yōu)化并整合。

優(yōu)點(diǎn)：
對于大型復(fù)雜任務(wù)具有可擴(kuò)展性。
模塊化設(shè)計(jì)便于實(shí)現(xiàn)專業(yè)化。
局限性：
需要復(fù)雜的協(xié)調(diào)機(jī)制。
在層級結(jié)構(gòu)的較高層級可能出現(xiàn)瓶頸。

4. 糾錯(cuò)智能體RAG

圖片

核心思想：通過反饋循環(huán)使智能體能夠迭代評估和優(yōu)化其輸出。
工作流程：

智能體生成初始回復(fù)。
一個(gè)評判模塊評估回復(fù)是否存在錯(cuò)誤或不一致之處。
智能體根據(jù)反饋優(yōu)化回復(fù)。
重復(fù)步驟2 - 3，直到輸出達(dá)到質(zhì)量標(biāo)準(zhǔn)。

優(yōu)點(diǎn)：
通過迭代改進(jìn)實(shí)現(xiàn)高準(zhǔn)確性和可靠性。
對于容易出錯(cuò)或高風(fēng)險(xiǎn)任務(wù)很有用。
局限性：
計(jì)算開銷增加。
反饋機(jī)制必須精心設(shè)計(jì)，以避免無限循環(huán)。

5. 自適應(yīng)智能體RAG

圖片

核心思想：根據(jù)任務(wù)要求動(dòng)態(tài)調(diào)整檢索策略和工作流程。
工作流程：

智能體評估查詢及其上下文。
根據(jù)可用數(shù)據(jù)和用戶需求實(shí)時(shí)調(diào)整檢索策略。
使用動(dòng)態(tài)工作流程合成回復(fù)。

優(yōu)點(diǎn)：
對于各種任務(wù)和動(dòng)態(tài)環(huán)境具有高度靈活性。
提高上下文相關(guān)性和用戶滿意度。
局限性：
設(shè)計(jì)強(qiáng)大的自適應(yīng)機(jī)制具有挑戰(zhàn)性。
實(shí)時(shí)調(diào)整會(huì)帶來計(jì)算開銷。

6. 基于圖的智能體RAG

基于圖的RAG系統(tǒng)通過整合基于圖的數(shù)據(jù)結(jié)構(gòu)進(jìn)行高級推理，擴(kuò)展了傳統(tǒng)的RAG。

6.1 Agent - G：用于圖RAG的智能體框架

圖片

核心思想：使用圖知識(shí)庫和反饋循環(huán)，動(dòng)態(tài)地將任務(wù)分配給專門的智能體。
工作流程：

從圖知識(shí)庫中提取關(guān)系（例如，疾病與癥狀的映射）。
用來自外部來源的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行補(bǔ)充。
使用評判模塊驗(yàn)證結(jié)果并迭代改進(jìn)。

優(yōu)點(diǎn)：
結(jié)合了結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
對于復(fù)雜任務(wù)具有模塊化和可擴(kuò)展性。
通過迭代優(yōu)化確保高準(zhǔn)確性。

6.2 GeAR：用于RAG的圖增強(qiáng)智能體

圖片

核心思想：通過圖擴(kuò)展技術(shù)和基于智能體的架構(gòu)增強(qiáng)RAG系統(tǒng)。
工作流程：

擴(kuò)展與查詢相關(guān)的圖，以更好地理解關(guān)系。
利用專門的智能體進(jìn)行多跳推理。
將圖結(jié)構(gòu)和非結(jié)構(gòu)化信息合成為回復(fù)。

優(yōu)點(diǎn)：
在多跳推理場景中表現(xiàn)出色。
提高深度上下文任務(wù)的準(zhǔn)確性。
能夠動(dòng)態(tài)適應(yīng)復(fù)雜的查詢環(huán)境。

7. 智能體文檔工作流（ADW）

智能體文檔工作流（ADW）通過利用智能體自動(dòng)化以文檔為中心的流程，對傳統(tǒng)的檢索增強(qiáng)生成（RAG）系統(tǒng)進(jìn)行了擴(kuò)展。

圖片

工作流程

文檔解析與結(jié)構(gòu)化：

a.從諸如發(fā)票或合同等文檔中提取結(jié)構(gòu)化數(shù)據(jù)。

狀態(tài)維護(hù)：

在多步驟工作流中跟蹤上下文，以確保一致性。

知識(shí)檢索：

從外部來源或特定領(lǐng)域的數(shù)據(jù)庫中檢索相關(guān)參考信息。

智能體編排：

應(yīng)用業(yè)務(wù)規(guī)則，進(jìn)行多步推理，并協(xié)調(diào)外部應(yīng)用程序編程接口（API）。

可執(zhí)行輸出生成：

生成針對特定用例定制的結(jié)構(gòu)化輸出（例如，報(bào)告或摘要）。

智能體RAG框架的對比分析

傳統(tǒng)RAG、智能體RAG以及智能體文檔工作流（ADW）。該分析突出了它們各自的優(yōu)勢、劣勢及最適用場景，為其在各種不同用例中的適用性提供了寶貴見解。

三種架構(gòu)框架進(jìn)行了全面的對比分析

關(guān)鍵要點(diǎn)

傳統(tǒng)RAG最適合需要基本檢索和生成能力的較簡單任務(wù)。
智能體RAG在多智能體協(xié)作推理方面表現(xiàn)出色，適用于更復(fù)雜的多領(lǐng)域任務(wù)。
智能體文檔工作流（ADW）為企業(yè)級應(yīng)用（如合同分析和發(fā)票處理）提供定制化的、以文檔為中心的解決方案。

參考文獻(xiàn)：Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG，https://arxiv.org/abs/2501.09136

責(zé)任編輯：武曉燕來源：大模型自然語言處理

RAG TF-IDF 數(shù)據(jù)

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<ruby id="1hvgx"><menuitem id="1hvgx"></menuitem></ruby>