偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

從簡(jiǎn)單查找到代理推理:聊聊智能RAG系統(tǒng)的興起 原創(chuàng)

發(fā)布于 2025-9-5 08:19
瀏覽
0收藏

檢索增強(qiáng)生成(RAG)是大語(yǔ)言模型領(lǐng)域的一項(xiàng)技術(shù),通過(guò)將外部數(shù)據(jù)檢索融入至生成過(guò)程,借此增強(qiáng)文本生成。與單純依賴模型預(yù)訓(xùn)練知識(shí)的傳統(tǒng)方式不同,RAG讓AI能夠從外部來(lái)自“查找信息”,顯著提高響應(yīng)準(zhǔn)確性與關(guān)聯(lián)度,有助于緩解幻覺(jué)及知識(shí)過(guò)時(shí)等問(wèn)題。換言之,RAG能夠超越靜態(tài)訓(xùn)練數(shù)據(jù)、為AI賦予動(dòng)態(tài)記憶。

隨著時(shí)間推移,一系列RAG架構(gòu)也應(yīng)運(yùn)而生——其解決的分別是特定早期缺陷,而種種簡(jiǎn)單概念如今已發(fā)展成為復(fù)雜的模式生態(tài),包括維護(hù)對(duì)話上下文、處理多個(gè)數(shù)據(jù)源以及提高檢索相關(guān)性。本文將按照演進(jìn)順序探討各主要RAG架構(gòu),討論各種新架構(gòu)如何繼承前續(xù)方案并解決自身局限性,同時(shí)通過(guò)可視化圖表介紹每種架構(gòu)所需解決的問(wèn)題及解決方案。

簡(jiǎn)單RAG

大模型先從靜態(tài)知識(shí)源(數(shù)據(jù)庫(kù)或向量索引)中檢索相關(guān)文檔,再基于檢索到的信息生成響應(yīng)。

簡(jiǎn)單RAG是檢索增強(qiáng)生成的最基本形式。當(dāng)用戶提出問(wèn)題時(shí),系統(tǒng)會(huì)從固定知識(shí)庫(kù)中檢索信息,將其提供給大模型以生成基于事實(shí)的答案。這種簡(jiǎn)單流程通常包含文檔存儲(chǔ)(外部數(shù)據(jù),例如數(shù)據(jù)庫(kù)或企業(yè)知識(shí)庫(kù))和用于查找/查詢相關(guān)的文本檢索器。如此一來(lái),即可確保答案最新且基于真實(shí)數(shù)據(jù),從而大大減少幻覺(jué)并提高準(zhǔn)確性。

  • 工作流:用戶提出查詢,系統(tǒng)從數(shù)據(jù)庫(kù)中檢索相關(guān)文檔,大模型根據(jù)這些文檔生成響應(yīng)。?
  • 用例:這種基本方法適用于范圍有限的靜態(tài)信息集,例如FAQ聊天機(jī)器人或文檔助手,配合產(chǎn)品手冊(cè)或知識(shí)庫(kù)確保響應(yīng)結(jié)果符合需求。?

從簡(jiǎn)單查找到代理推理:聊聊智能RAG系統(tǒng)的興起-AI.x社區(qū)

局限:簡(jiǎn)單RAG雖比單獨(dú)使用大模型更有改進(jìn),但仍有缺點(diǎn)——它會(huì)孤立處理各項(xiàng)查詢,不具備先前交互或上下文記錄。在多輪對(duì)話或者要求AI記住先前所說(shuō)內(nèi)容的場(chǎng)景中,簡(jiǎn)單RAG會(huì)顯得力不從心。它無(wú)法將信息從一個(gè)問(wèn)題傳遞至下一問(wèn)題,往往導(dǎo)致答案重復(fù)或不一致。因此上下文管理,就成了RAG下一代演進(jìn)希望解決的主要挑戰(zhàn)。

帶記憶功能的簡(jiǎn)單RAG

此架構(gòu)通過(guò)添加記憶組件擴(kuò)展了簡(jiǎn)單RAG,系統(tǒng)可在生成響應(yīng)時(shí)整合先前用戶交互中存儲(chǔ)的上下文、以及新檢索到的文檔。

帶記憶功能的簡(jiǎn)單RAG解決了上下文限制,為AI模型引入持久記憶存儲(chǔ),可保留先前交互中的信息。實(shí)際上,模型現(xiàn)在可以記住用戶之前提出的問(wèn)題或給出的答案,并將其與新檢索到的數(shù)據(jù)共同用于當(dāng)前查詢,從而保持對(duì)話連續(xù)性并避免忘記先前細(xì)節(jié)。

  • 工作流:用戶提交查詢。系統(tǒng)首先訪問(wèn)記憶,從之前的對(duì)話或存儲(chǔ)的上下文中檢索信息。接下來(lái),它會(huì)執(zhí)行常規(guī)文檔檢索,從外部知識(shí)源處獲取新信息。最后,大模型生成答案并整合先前上下文(來(lái)自記憶)及新檢索到的事實(shí)。?
  • 用例:此架構(gòu)特別適合客服或個(gè)人助理領(lǐng)域的聊天機(jī)器人和對(duì)話智能體,它可以回憶起用戶姓名或之前聊天中遇到的問(wèn)題,從而提供更佳體驗(yàn)。此外,此架構(gòu)也適用于個(gè)性化推薦或任何需要?dú)v史背景信息來(lái)指導(dǎo)當(dāng)前響應(yīng)的場(chǎng)景。?

從簡(jiǎn)單查找到代理推理:聊聊智能RAG系統(tǒng)的興起-AI.x社區(qū)

記憶的引入,讓RAG解決了上下文連續(xù)性這一挑戰(zhàn)。但隨著應(yīng)用場(chǎng)景的增加,新的挑戰(zhàn)再次出現(xiàn):并非所有查詢都只指向同一數(shù)據(jù)源。帶記憶的簡(jiǎn)單RAG只會(huì)查詢一組固定文檔,但如果組織擁有多個(gè)知識(shí)庫(kù)或工具,又該怎么辦?每次查詢所有知識(shí)庫(kù)或工具會(huì)拉低效率,因此新的方案需要讓檢索更加智能以確定查找位置。

分支RAG

這種架構(gòu)會(huì)將查詢路由至不同知識(shí)源。系統(tǒng)不再搜索所有內(nèi)容,而是根據(jù)查詢分支到最相關(guān)的數(shù)據(jù)源(數(shù)據(jù)庫(kù)、API、文檔集等)。

分支RAG引入了智能源選擇功能,通過(guò)評(píng)估查詢并將檢索定向至最適合的資源以提升執(zhí)行效率。換言之,RAG管線可以根據(jù)具體問(wèn)題分支至不同信息源。

  • 工作流:分析用戶查詢,由系統(tǒng)決定哪些知識(shí)源最可能包含答案(即路由或分支選擇器)。例如,將法律問(wèn)題路由至法律數(shù)據(jù)庫(kù),編程問(wèn)題則路由至Stack Overflow歸檔。之后,系統(tǒng)只查詢特定源,再由大模型根據(jù)目標(biāo)信息生成答案。?
  • 用例:分支RAG在處理跨領(lǐng)域或大型異構(gòu)語(yǔ)料庫(kù)時(shí)表現(xiàn)出色。例如,大公司的AI助手可能需要處理人力資源政策問(wèn)題、IT 支持問(wèn)題以及財(cái)務(wù)數(shù)據(jù)查找。通過(guò)分支檢索,助手可以為每個(gè)查詢選擇正確的內(nèi)部數(shù)據(jù)庫(kù),避免搜索完整索引,或者因?yàn)樵阱e(cuò)誤的位置查找而丟失答案。由于不相關(guān)的來(lái)源會(huì)被跳過(guò),因此得到的響應(yīng)將更加高效、準(zhǔn)確。?

從簡(jiǎn)單查找到代理推理:聊聊智能RAG系統(tǒng)的興起-AI.x社區(qū)

通過(guò)將查詢路由至正確的源,分支RAG可以降低噪聲并提高準(zhǔn)確率。它解決了在多個(gè)知識(shí)庫(kù)中擴(kuò)展RAG的難題。然而,如果查詢不明確或未直接匹配任何文檔,又該怎么辦?在這種情況下,即使是智能分支也可能檢索不到任何有用的信息。下一代創(chuàng)新方案解決了這個(gè)問(wèn)題——當(dāng)用戶的問(wèn)題不夠具體時(shí),模型會(huì)主動(dòng)設(shè)想出更好的查詢表達(dá)來(lái)指導(dǎo)檢索。

HyDe(假設(shè)文檔嵌入)

在搜索知識(shí)庫(kù)之前,模型會(huì)根據(jù)查詢創(chuàng)建一個(gè)假設(shè)文檔或理想的答案嵌入,再據(jù)此檢索與“理想”內(nèi)容匹配的真實(shí)文檔。

HyDe(假設(shè)文檔嵌入)是RAG的一個(gè)獨(dú)特變體,用于解決模糊或難以匹配的查詢問(wèn)題。在之前的架構(gòu)中,檢索直接由用戶的查詢驅(qū)動(dòng)。但如果查詢措辭不當(dāng)或范圍過(guò)廣,系統(tǒng)可能無(wú)法獲取最佳信息。HyDe給出的答案是,模型首先在內(nèi)部生成一個(gè)假設(shè)的答案或文檔(即模型認(rèn)為理想答案應(yīng)該包含的內(nèi)容),將其轉(zhuǎn)換為嵌入,然后檢索與該假設(shè)內(nèi)容類似的實(shí)際文檔。這可以顯著提高檢索到的信息與復(fù)雜查詢的相關(guān)性。

  • 工作流:用戶提供提示詞,系統(tǒng)使用大模型(或其他生成組件)創(chuàng)建一份假設(shè)的文檔/答案表達(dá)。此假設(shè)不會(huì)顯示給用戶;相反,它會(huì)被轉(zhuǎn)換成一個(gè)嵌入向量,再利用它從知識(shí)庫(kù)中檢索最接近該理想答案的真實(shí)文檔。最后,大模型使用檢索到的文檔生成最終答案。?
  • 用例:HyDe主要適用于研究和創(chuàng)造性查詢。例如,若用戶提出一個(gè)高開放度問(wèn)題,如“技術(shù)對(duì)認(rèn)知培養(yǎng)有何影響?”這時(shí)HyDe會(huì)首先讓模型假設(shè)一個(gè)答案(可能涉及注意力持續(xù)時(shí)間、記憶力、屏幕時(shí)間研究等概念),再使用此答案獲取涉及這些概念的文檔。在創(chuàng)意內(nèi)容生成方面,HyDe則可嘗試生成“理想”敘述,并用檢索到的事實(shí)細(xì)節(jié)進(jìn)一步加以充實(shí)。?

從簡(jiǎn)單查找到代理推理:聊聊智能RAG系統(tǒng)的興起-AI.x社區(qū)

當(dāng)用戶查詢不精確時(shí),HyDe可以有效解決檢索難題。通過(guò)使用模型生成的答案預(yù)覽來(lái)引導(dǎo)搜索,它提高了找到正確信息的幾率。這雖然增加了復(fù)雜性,但對(duì)于復(fù)雜問(wèn)題卻能產(chǎn)生更好的結(jié)果。到目前為止,我們所見過(guò)的架構(gòu)仍然遵循針對(duì)每個(gè)查詢的固定策略(內(nèi)存或分支有所不同)。接下來(lái),我們將介紹一種可以根據(jù)查詢需求動(dòng)態(tài)調(diào)整檢索策略的方法,從而使流程更高效,并可針對(duì)各種工作負(fù)載進(jìn)行擴(kuò)展。

自適應(yīng)RAG

這是一種有條件的檢索策略。系統(tǒng)會(huì)檢查查詢并決定如何檢索信息:簡(jiǎn)單查詢往往能輕易對(duì)應(yīng)一個(gè)來(lái)源,而復(fù)雜查詢則會(huì)觸發(fā)更廣泛的檢索(多個(gè)來(lái)源或迭代搜索)。這種適應(yīng)性優(yōu)化了速度與深度。

自適應(yīng) RAG 是一種動(dòng)態(tài)方法,其理念是根據(jù)問(wèn)題的復(fù)雜性或性質(zhì)調(diào)整檢索策略。較簡(jiǎn)單的查詢會(huì)獲得輕量級(jí)的檢索(以提高速度),而較難的查詢會(huì)獲得更繁重、多方面的檢索(以提高完整性)。這種架構(gòu)解決了早期系統(tǒng)中的一個(gè)挑戰(zhàn):使用一刀切的檢索流程。在簡(jiǎn)單RAG中,無(wú)論問(wèn)題是“法國(guó)的首都是哪里?”還是詳細(xì)的分析查詢,系統(tǒng)可能總是從相同的位置檢索相同數(shù)量的文檔。自適應(yīng)RAG則引入邏輯,使其更加高效和靈活。

  • 工作流:用戶提交查詢后,系統(tǒng)首先對(duì)查詢復(fù)雜度進(jìn)行初步分析,而后將其劃入不同檢索模式。對(duì)于簡(jiǎn)單的事實(shí)性問(wèn)題,可能只需查詢單個(gè)可信源或檢索少數(shù)片段。對(duì)于復(fù)雜問(wèn)題,則可擴(kuò)展至多個(gè)數(shù)據(jù)庫(kù)/API,或使用迭代搜索策略。檢索完成后,大模型會(huì)正常生成答案,最關(guān)鍵的差異在于檢索信息的數(shù)量和來(lái)源要根據(jù)查詢進(jìn)行定制。?
  • 用例:自適應(yīng)RAG在企業(yè)搜索或需要處理不同難度級(jí)別的混合類型查詢場(chǎng)景下表現(xiàn)出色。以AI研究助手為例,有些查詢只涉及簡(jiǎn)單定義、有些則需要深入研究科學(xué)文獻(xiàn)。對(duì)于前者,自適應(yīng)RAG會(huì)在詞匯表中快速查找;對(duì)于后者,RAG則在多個(gè)研究論文數(shù)據(jù)庫(kù)中執(zhí)行廣泛搜索。這確保了簡(jiǎn)單查詢能夠迅速得到響應(yīng),復(fù)雜查詢則產(chǎn)生更高的檢索成本,從而根據(jù)具體情況在速度與深度間尋求最佳平衡。?

從簡(jiǎn)單查找到代理推理:聊聊智能RAG系統(tǒng)的興起-AI.x社區(qū)

通過(guò)自適應(yīng)查詢復(fù)雜度,該架構(gòu)可以避免不必要的過(guò)度檢索,并確保必要檢索的完整性。它解決了每條查詢(無(wú)論簡(jiǎn)單還是復(fù)雜)都使用相同的繁重管線處理時(shí)可能出現(xiàn)的效率和可擴(kuò)展性問(wèn)題。然而,即使采用自適應(yīng)策略,之前提到的所有架構(gòu)都具有一個(gè)共同點(diǎn):它們信任檢索到的文檔并生成答案。如果檢索到的信息具有誤導(dǎo)性或不足之處,該怎么辦?接下來(lái)的架構(gòu)明確解決了初始檢索可能質(zhì)量不高的情況,通過(guò)引入額外步驟,在回答之前對(duì)檢索到的知識(shí)進(jìn)行批判性評(píng)估和糾正。

糾正式RAG (CRAG)

此架構(gòu)增加了自檢和改進(jìn)循環(huán)。檢索到的文檔被分解成“知識(shí)條”,并根據(jù)相關(guān)性進(jìn)行評(píng)分。如果檢索結(jié)果不夠好(未達(dá)到相關(guān)度閾值),系統(tǒng)會(huì)在生成最終答案之前執(zhí)行額外檢索(如網(wǎng)頁(yè)搜索或替代查詢)。

糾正式RAG(CRAG)在標(biāo)準(zhǔn)RAG流程的基礎(chǔ)上,增加了對(duì)檢索內(nèi)容的反思機(jī)制。其目的是捕捉初始檢索可能未達(dá)標(biāo)的情況——例如檢索到的文檔偏離主題、過(guò)時(shí)或不完整——并在生成最終答案之前進(jìn)行修復(fù)。在早期架構(gòu)中,如果檢索到的信息質(zhì)量較差,大模型可能會(huì)得出錯(cuò)誤的答案,或者產(chǎn)生幻覺(jué)來(lái)填補(bǔ)空白。CRAG 則會(huì)對(duì)檢索到的信息進(jìn)行質(zhì)量評(píng)級(jí),并在必要時(shí)進(jìn)行迭代。

  • 工作流:在常規(guī)檢索步驟之后,CRAG會(huì)將檢索到的文本拆分成更小的片段(即「知識(shí)條」),而后評(píng)估各片段與查詢間的相關(guān)度。如果知識(shí)條未達(dá)到特定相關(guān)度或質(zhì)量閾值,則系統(tǒng)不會(huì)生成。相反,它會(huì)尋找更多信息(如擴(kuò)大網(wǎng)絡(luò)搜索范圍或查詢不同數(shù)據(jù)庫(kù))以補(bǔ)充或替換薄弱部分。只有在大模型擁有足夠相關(guān)文檔集后,才會(huì)生成答案。本質(zhì)上,CRAG是在最終答案前插入了檢索-評(píng)估-優(yōu)化的循環(huán)。?
  • 用例:糾正式RAG特別適合風(fēng)險(xiǎn)高或?qū)?zhǔn)確性要求嚴(yán)格的應(yīng)用場(chǎng)景,例如法律分析、醫(yī)學(xué)問(wèn)答或財(cái)務(wù)報(bào)告。例如,使用CRAG的醫(yī)療聊天機(jī)器人可能會(huì)從醫(yī)療數(shù)據(jù)庫(kù)中檢索信息;如果這些文檔無(wú)法直接回答患者問(wèn)題,系統(tǒng)可能會(huì)自動(dòng)在線搜索最新醫(yī)學(xué)文獻(xiàn)或臨床指南,以確保沒(méi)有遺漏任何關(guān)鍵細(xì)節(jié)。CRAG的自我評(píng)分步驟有助于發(fā)現(xiàn)錯(cuò)誤或遺漏,從而顯著提高輸出質(zhì)量。?

從簡(jiǎn)單查找到代理推理:聊聊智能RAG系統(tǒng)的興起-AI.x社區(qū)

通過(guò)在檢索數(shù)據(jù)中加入反饋循環(huán),CRAG解決了RAG系統(tǒng)中“垃圾進(jìn),垃圾出”的難題。如果它認(rèn)為源材料的相關(guān)度不高,則會(huì)拒絕生成答案,從而進(jìn)一步減少幻覺(jué)并提高可靠性。不過(guò)在CRAG中,檢索過(guò)程仍然發(fā)生在生成步驟之前(可能需要多次傳遞)。新的迭代方案希望模糊這條界限:如果模型可以在生成答案的過(guò)程中決定檢索更多信息,會(huì)怎么樣?這就是自RAG的作用所在——它賦予大模型更大的自主權(quán),使其能夠在制定響應(yīng)時(shí)動(dòng)態(tài)提取新數(shù)據(jù)。

自RAG

模型在生成過(guò)程中參與自驅(qū)動(dòng)檢索循環(huán)。在構(gòu)建答案的過(guò)程中,大模型可以檢測(cè)知識(shí)缺口或不確定性,然后制定并發(fā)出新的查詢以獲取更多信息(自查詢),然后再繼續(xù)。此迭代循環(huán)持續(xù)進(jìn)行,直到答案完整且得到充分支持。

自驅(qū)動(dòng)檢索循環(huán)更進(jìn)一步,允許大模型在生成響應(yīng)時(shí)主動(dòng)檢索更多信息。與之前提到的架構(gòu)(每查詢僅在模型上實(shí)際進(jìn)行一次檢索)不同,自驅(qū)動(dòng)檢索循環(huán)實(shí)現(xiàn)了更具交互性的流程。一旦模型意識(shí)到需要更多數(shù)據(jù)(例如出現(xiàn)了子問(wèn)題或不完全確定答案),它可以暫停并獲取更多內(nèi)容,然后繼續(xù)回答。這解決了標(biāo)準(zhǔn)RAG流程中的一大局限:在開始生成答案前,模型有時(shí)并不確定自己是否了解答案。自RAG通過(guò)在回答過(guò)程中動(dòng)態(tài)提取信息,確保模型能夠覆蓋這些盲點(diǎn)。

  • 工作流:用戶提出問(wèn)題,系統(tǒng)正常進(jìn)行初始檢索并開始生成。在生成過(guò)程中,大模型會(huì)監(jiān)控自身輸出,查找空白或不確定點(diǎn)所在,而后構(gòu)建一個(gè)與該子主題相關(guān)的新內(nèi)部查詢。由此觸發(fā)的自檢索循環(huán)可以獲取其他相關(guān)文檔或數(shù)據(jù),將新信息整合至答案中并繼續(xù)生成。整個(gè)過(guò)程可以多次發(fā)生,直到模型認(rèn)為答案全面且具有充分的依據(jù)。?
  • 用例:自RAG在探索性任務(wù)和復(fù)雜問(wèn)答方面表現(xiàn)極佳。這里設(shè)想撰寫深度報(bào)告的場(chǎng)景:當(dāng)AI起草某個(gè)部分時(shí),可能會(huì)意識(shí)到需要更多統(tǒng)計(jì)數(shù)據(jù)或?qū)μ囟ǜ拍畹慕忉尅S后可以即時(shí)獲取這些信息。另一個(gè)例子則是開放域問(wèn)答中的多跳問(wèn)題(如「找出文檔X中概念A(yù)與文檔Y中概念B之間的聯(lián)系」)。自RAG系統(tǒng)可以檢索概念A(yù)的信息、進(jìn)行解釋,而后意識(shí)到還須檢索概念B及二者的聯(lián)系,最終確定答案。這種方法確保了結(jié)果更全面,讓所有查詢細(xì)節(jié)均得到解決。?

從簡(jiǎn)單查找到代理推理:聊聊智能RAG系統(tǒng)的興起-AI.x社區(qū)

總而言之,自RAG賦予模型一定程度的自主權(quán)來(lái)指導(dǎo)其自身的檢索,從而有效地使檢索生成邊界更加靈活。它解決了答案構(gòu)建過(guò)程中不可預(yù)見的信息需求問(wèn)題。這是邁向更類似智能體行為的重要一步,為我們討論的最先進(jìn)的架構(gòu)——代理式RAG——奠定了基礎(chǔ)。代理式RAG不僅能夠進(jìn)行自我檢索,還能以目標(biāo)導(dǎo)向的方式協(xié)調(diào)多個(gè)智能體和工具,處理超越單一問(wèn)答的極其復(fù)雜的查詢或任務(wù),從而將這一理念推廣開來(lái)。

代理式RAG

一種先進(jìn)的多智能體檢索架構(gòu)。其中RAG系統(tǒng)的行為類似于一個(gè)能夠執(zhí)行多步推理并與多個(gè)數(shù)據(jù)源或工具交互的智能體。頂端元智能體可能會(huì)為每個(gè)數(shù)據(jù)源或數(shù)據(jù)塊生成專門的文檔代理,收集它們的發(fā)現(xiàn),然后合成最終答案。

代理式RAG代表了RAG架構(gòu)的最前沿,其模型以更加自主、目標(biāo)驅(qū)動(dòng)的方式運(yùn)行,而非單一的問(wèn)答系統(tǒng)。在代理式RAG中,AI 可以將復(fù)雜的查詢分解為子任務(wù),調(diào)用多個(gè)智能體(可以是 LLM 實(shí)例或?qū)S脵z索模塊)來(lái)處理不同的部分,然后組合生成結(jié)果。這種架構(gòu)的靈感源于新興的AI智能體趨勢(shì),各智能體可以規(guī)劃、推理、使用工具并執(zhí)行多步驟操作來(lái)滿足用戶請(qǐng)求。它直接解決了單步RAG無(wú)法處理的復(fù)雜查詢難題——例如,需要跨多個(gè)文檔進(jìn)行推理、執(zhí)行中間計(jì)算或與外部系統(tǒng)(API、數(shù)據(jù)庫(kù))交互(而不僅僅是獲取文本)的查詢。

  • 工作流:最常見的模式為:用戶提交復(fù)雜查詢或任務(wù),RAG系統(tǒng)以智能體形式激活,生成多個(gè)特定于文檔的智能體或工具調(diào)用。如需要進(jìn)行市場(chǎng)分析時(shí),系統(tǒng)可以創(chuàng)建一個(gè)智能體以檢索財(cái)務(wù)數(shù)據(jù),另一智能體收集新聞文章,第三智能體負(fù)責(zé)獲取專家意見。頂端元智能體負(fù)責(zé)監(jiān)督這些工作,并決定按何種順序執(zhí)行。各子智能體分別檢索或計(jì)算所屬任務(wù),最終由元智能體綜合所有信息,由大模型生成連續(xù)的最終報(bào)告/答案。在此過(guò)程中,智能體系統(tǒng)可以做出“若信息源A的數(shù)據(jù)不足,須咨詢信息源B”或“就X提出后續(xù)問(wèn)題”等決策。這在本質(zhì)上形成一套靈活的框架,涵蓋大量彼此協(xié)調(diào)的檢索和生成步驟,以服務(wù)于更高目標(biāo)。?
  • 用例:代理式RAG非常適合開放式研究、多源分析或任何需要人工執(zhí)行多項(xiàng)查找及推理步驟的復(fù)雜任務(wù)。以編寫競(jìng)爭(zhēng)性商業(yè)報(bào)告的自動(dòng)化研究助手為例,具體任務(wù)可能包括:查詢財(cái)務(wù)數(shù)據(jù)庫(kù)、閱讀多份報(bào)告,通過(guò)API獲取社交媒體情緒并匯總所有內(nèi)容。代理式RAG特別適合需要自主確定檢索內(nèi)容以及如何整合多來(lái)源信息的場(chǎng)景,其本質(zhì)上相當(dāng)于一個(gè)能夠“自主研究”的AI智能體。?

從簡(jiǎn)單查找到代理推理:聊聊智能RAG系統(tǒng)的興起-AI.x社區(qū)

通過(guò)部署多個(gè)智能體并規(guī)劃?rùn)z索操作,代理式RAG克服了簡(jiǎn)單RAG系統(tǒng)在處理復(fù)雜性和規(guī)模方面的局限性。它標(biāo)志著信息檢索和合成從預(yù)定義流水線向更具適應(yīng)性的規(guī)劃器-執(zhí)行器范式的轉(zhuǎn)變。當(dāng)然,這種強(qiáng)大的能力也帶來(lái)了設(shè)計(jì)的復(fù)雜性增加,以及在確保智能體保持一致和高效方面的潛在挑戰(zhàn)。

總結(jié)

從簡(jiǎn)單RAG到代理式RAG的演進(jìn),體現(xiàn)了AI系統(tǒng)不斷提升知識(shí)儲(chǔ)備、可靠性和情境感知能力的持續(xù)探索。每個(gè)新架構(gòu)都建立在前一個(gè)架構(gòu)的基礎(chǔ)上,用以解決一個(gè)特定瓶頸:簡(jiǎn)單RAG引入外部知識(shí)以減少幻覺(jué);帶記憶的RAG保留了上下文;分支RAG使檢索具備源感知能力;HyDe提高了模糊查詢的相關(guān)性;自適應(yīng)RAG 優(yōu)化了每個(gè)查詢的執(zhí)行工作量;糾正式RAG對(duì)檢索到的信息進(jìn)行質(zhì)量檢查;自RAG使模型能夠迭代地填補(bǔ)空白;而代理式RAG則支持跨源進(jìn)行復(fù)雜的多步驟推理。整個(gè)演進(jìn)過(guò)程本質(zhì)上是一系列創(chuàng)新,旨在滿足日益復(fù)雜的AI應(yīng)用實(shí)際需求。

RAG架構(gòu)的選擇取決于實(shí)際應(yīng)用程序需求。簡(jiǎn)單架構(gòu)更易于實(shí)現(xiàn),足以勝任簡(jiǎn)單的任務(wù),而高級(jí)架構(gòu)則會(huì)以更高的復(fù)雜性為代價(jià)來(lái)解鎖更多功能。例如,如果你只需要一個(gè)用于單個(gè)數(shù)據(jù)庫(kù)的事實(shí)機(jī)器人,那么簡(jiǎn)單RAG可能就足夠了。但是,如果你正在打造一名AI研究分析師,或許可以考慮使用代理式RAG來(lái)處理涵蓋廣泛和深度的查詢。理解這些模式至關(guān)重要——這既是一項(xiàng)技術(shù)決策,也是一項(xiàng)戰(zhàn)略決策,會(huì)影響用戶體驗(yàn)和系統(tǒng)性能。

有一點(diǎn)是明確的:隨著我們不斷突破AI利用海量信息的能力邊界,RAG也在快速發(fā)展。通過(guò)利用合適的架構(gòu),我們賦能AI系統(tǒng),使其不僅能夠檢索知識(shí),還能以智能且情境化的方式進(jìn)行檢索。這使得它們生成的響應(yīng)更加準(zhǔn)確、相關(guān),更好地幫助用戶解決問(wèn)題。演進(jìn)過(guò)程中的每一步都讓我們更接近真正能夠充當(dāng)專家級(jí)研究助手的 AI——能夠記住上下文、找到最佳來(lái)源、反復(fù)核實(shí)事實(shí)、并推理復(fù)雜問(wèn)題,最終給出更加準(zhǔn)確可靠的答案。

原文標(biāo)題:???From Simple Lookups to Agentic Reasoning: The Rise of Smart RAG Systems??,作者:Naresh Dulam

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦