偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<li id="i53de"></li>

<pre id="i53de"></pre>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

從簡(jiǎn)單RAG到智能體RAG：解鎖更智能的AI工作流（AI工程師視角）

作者：大模型之路 2025-10-11 01:45:00

理解兩者的權(quán)衡（速度與深度、簡(jiǎn)潔與精準(zhǔn)）后，AI工程師才能選擇合適的方案，在滿足具體需求的同時(shí)，推動(dòng)智能自動(dòng)化的邊界。你對(duì)這兩種RAG方案有何看法？

作為一名在檢索系統(tǒng)優(yōu)化與大語(yǔ)言模型（LLM）幻覺問(wèn)題上投入無(wú)數(shù)時(shí)間的AI工程師，我親眼見證了檢索增強(qiáng)生成（RAG）如何從一款簡(jiǎn)單工具演變?yōu)楦邉?dòng)態(tài)性的技術(shù)。如今，我想深入探討傳統(tǒng)“簡(jiǎn)單”RAG與其更先進(jìn)的變體——智能體RAG（Agentic RAG）之間的差異，尤其聚焦于基于關(guān)鍵詞的搜索機(jī)制與語(yǔ)義/相關(guān)性搜索機(jī)制的區(qū)別。我們還將剖析究竟是什么讓AI系統(tǒng)具備“智能體屬性”，同時(shí)結(jié)合我在實(shí)際落地過(guò)程中遇到的挑戰(zhàn)、優(yōu)勢(shì)與權(quán)衡，分享一些關(guān)鍵見解。

如果你正在構(gòu)建AI應(yīng)用，理解這一技術(shù)演進(jìn)不僅是理論層面的需求，更是打造精準(zhǔn)、靈活且可擴(kuò)展系統(tǒng)的關(guān)鍵。接下來(lái)，讓我們一步步拆解其中的核心邏輯。

一、什么是AI智能體？

在對(duì)比不同RAG變體之前，我們首先要明確：是什么讓一個(gè)系統(tǒng)從“工具”升級(jí)為“智能體”？根據(jù)我的實(shí)踐經(jīng)驗(yàn)，AI智能體絕非被動(dòng)的響應(yīng)器，而是具備感知環(huán)境、自主決策、采取行動(dòng)以實(shí)現(xiàn)目標(biāo)的獨(dú)立實(shí)體。其核心特征可概括為以下五點(diǎn)：

自主性（Autonomy）：智能體能夠獨(dú)立運(yùn)行，無(wú)需持續(xù)的人工干預(yù)。它們可以將復(fù)雜任務(wù)拆解為子任務(wù)，并以串行或并行方式執(zhí)行。
感知與推理（Perception and Reasoning）：通過(guò)API、檢索工具等“傳感器”收集數(shù)據(jù)，再借助邏輯分析、規(guī)劃能力甚至反饋學(xué)習(xí)進(jìn)行推理。
行動(dòng)導(dǎo)向（Action-Oriented）：與靜態(tài)模型不同，智能體能夠與外部世界交互——例如查詢數(shù)據(jù)庫(kù)、調(diào)用外部工具，或?qū)ψ陨磔敵鲞M(jìn)行迭代優(yōu)化。
適應(yīng)性（Adaptability）：面對(duì)不確定性時(shí)，智能體可調(diào)整策略，比如根據(jù)新信息重新規(guī)劃路徑，或?qū)﹀e(cuò)誤進(jìn)行處理。
目標(biāo)驅(qū)動(dòng)（Goal-Directed Behavior）：所有行動(dòng)都圍繞明確目標(biāo)展開，無(wú)論是精準(zhǔn)回答問(wèn)題，還是優(yōu)化某個(gè)業(yè)務(wù)流程。

在RAG場(chǎng)景中，這種“智能體屬性”將簡(jiǎn)單的“查詢-響應(yīng)”循環(huán)升級(jí)為復(fù)雜的工作流。換句話說(shuō)，這相當(dāng)于給AI賦予了“大腦”——它不僅能調(diào)取事實(shí)，還能主動(dòng)搜尋、驗(yàn)證并整合信息。

二、簡(jiǎn)單RAG與智能體RAG：核心差異

本質(zhì)上，RAG的核心價(jià)值是通過(guò)在生成過(guò)程中注入外部知識(shí)，解決獨(dú)立LLM的局限性。但兩者的差距體現(xiàn)在細(xì)節(jié)中——尤其是檢索的實(shí)現(xiàn)方式，以及是否通過(guò)迭代過(guò)程中的嵌入（Embedding）構(gòu)建循環(huán)機(jī)制。

（1）簡(jiǎn)單RAG：一次性檢索模式

簡(jiǎn)單RAG類似圖書館的“快速查詢”：將用戶查詢轉(zhuǎn)化為嵌入向量，從向量庫(kù)中檢索相關(guān)文檔（基于語(yǔ)義相似性或關(guān)鍵詞匹配），再將文檔輸入LLM生成回答。這種模式效率高，但局限性也很明顯。

工作流：查詢 → 嵌入（若為語(yǔ)義檢索）→ 檢索（Top-K匹配結(jié)果）→ 生成回答。
語(yǔ)義/相關(guān)性搜索：依賴嵌入模型（如BERT、OpenAI的text-embedding-ada）捕捉語(yǔ)義。查詢被轉(zhuǎn)化為向量后，通過(guò)余弦相似度找到“相關(guān)”的文本片段。這種方式能更好地處理語(yǔ)言歧義，但如果嵌入模型未經(jīng)過(guò)微調(diào)，可能會(huì)檢索到無(wú)關(guān)噪聲。
無(wú)循環(huán)機(jī)制：流程呈線性——一次檢索對(duì)應(yīng)一次生成。若數(shù)據(jù)過(guò)時(shí)或存在沖突，系統(tǒng)無(wú)法修正，可能導(dǎo)致幻覺或回答不完整。
優(yōu)勢(shì)：低延遲、運(yùn)行成本低、易于實(shí)現(xiàn)。
劣勢(shì)：靜態(tài)化，無(wú)法處理“多跳問(wèn)題”（例如“X對(duì)Y的影響是什么？”），也無(wú)法應(yīng)對(duì)實(shí)時(shí)數(shù)據(jù)更新。

在我的項(xiàng)目中，簡(jiǎn)單RAG在基礎(chǔ)問(wèn)答機(jī)器人場(chǎng)景中表現(xiàn)出色，但面對(duì)復(fù)雜且動(dòng)態(tài)的查詢（如需要實(shí)時(shí)更新數(shù)據(jù)的股票分析）時(shí)，就會(huì)顯得力不從心。

（2）智能體RAG：帶嵌入的迭代循環(huán)模式

智能體RAG通過(guò)引入“循環(huán)機(jī)制”實(shí)現(xiàn)了升級(jí)，讓系統(tǒng)更具“智能體屬性”。在這里，檢索不再是“一次性操作”，而是反饋循環(huán)的一部分——AI會(huì)評(píng)估自身輸出、優(yōu)化查詢、反復(fù)迭代，直至滿足目標(biāo)。

工作流：查詢 → 初步規(guī)劃 → 循環(huán)（查詢/子查詢嵌入 → 檢索 → 推理/驗(yàn)證 → 按需優(yōu)化）→ 最終整合與生成。
含嵌入的循環(huán)機(jī)制：這是智能體RAG的核心亮點(diǎn)。嵌入不僅用于初始檢索，還會(huì)在每一輪迭代中重新應(yīng)用。例如：

先通過(guò)基于嵌入的搜索獲取廣泛結(jié)果；

分析結(jié)果，生成子查詢（如“驗(yàn)證來(lái)源Y中的事實(shí)X”）；

將子查詢重新嵌入，檢索更精準(zhǔn)的信息；

重復(fù)循環(huán)，直至置信度達(dá)到閾值。整個(gè)過(guò)程可結(jié)合“混合搜索”——用關(guān)鍵詞確保精準(zhǔn)度，用語(yǔ)義嵌入保證相關(guān)性。

語(yǔ)義/相關(guān)性搜索：驅(qū)動(dòng)循環(huán)的核心動(dòng)力，讓智能體能夠動(dòng)態(tài)探索相關(guān)概念。LangChain、LlamaIndex等工具已實(shí)現(xiàn)這一流程的無(wú)縫集成。
智能體特征：循環(huán)機(jī)制賦予系統(tǒng)決策能力（如“該數(shù)據(jù)是否可靠？是否需要切換數(shù)據(jù)源？”）與適應(yīng)性（如“若需要圖片信息，切換至多模態(tài)檢索”）。
優(yōu)勢(shì)：能處理復(fù)雜任務(wù)，通過(guò)驗(yàn)證減少錯(cuò)誤。
劣勢(shì)：迭代過(guò)程需更多計(jì)算資源，成本更高。

兩者的本質(zhì)區(qū)別在于“響應(yīng)方式”：簡(jiǎn)單RAG是“直線路徑”，而智能體RAG是“與數(shù)據(jù)對(duì)話”——通過(guò)嵌入循環(huán)逐步構(gòu)建對(duì)問(wèn)題的深度理解。

三、混合搜索的戰(zhàn)略價(jià)值：為何嵌入后需要關(guān)鍵詞搜索？

在生產(chǎn)系統(tǒng)中，我發(fā)現(xiàn)最有效的模式之一是：將基于BM25的關(guān)鍵詞搜索作為“二次過(guò)濾層”，應(yīng)用于初始嵌入檢索之后。這種混合策略并非理論構(gòu)想，而是能解決純語(yǔ)義搜索的痛點(diǎn)——尤其在電商、產(chǎn)品檢索等場(chǎng)景中效果顯著。

1. 嵌入檢索的“盲區(qū)”問(wèn)題

嵌入模型擅長(zhǎng)捕捉語(yǔ)義，但往往會(huì)忽略用戶明確的“精確匹配”需求。以電商場(chǎng)景為例，若用戶搜索“Nike Air Max 10碼運(yùn)動(dòng)鞋”，純嵌入檢索可能出現(xiàn)以下問(wèn)題：

初始嵌入檢索：向量搜索可能返回“Adidas跑步鞋”“運(yùn)動(dòng)服飾”“Nike休閑鞋”等語(yǔ)義相似結(jié)果——這些結(jié)果雖與“運(yùn)動(dòng)鞋”概念相關(guān)，卻遺漏了“Nike Air Max”品牌型號(hào)與“10碼”尺寸的關(guān)鍵需求。
關(guān)鍵詞過(guò)濾的補(bǔ)救作用：在嵌入檢索獲取100個(gè)候選結(jié)果后，BM25/關(guān)鍵詞搜索可作為“精準(zhǔn)過(guò)濾器”：

篩選精確匹配：“Nike”且“Air Max”；

確保尺寸匹配：“10碼”；

剔除嵌入檢索引入的無(wú)關(guān)結(jié)果（如Nike服飾、其他品牌鞋子）。

此外，在電商等場(chǎng)景中，若用戶查詢“鞋子”，絕不能返回“襪子”——關(guān)鍵詞過(guò)濾能確保品類精準(zhǔn)度，避免因“ footwear（鞋類）”的語(yǔ)義重疊導(dǎo)致無(wú)關(guān)結(jié)果。

2. 電商場(chǎng)景的真實(shí)案例

案例1：徒步靴搜索

用戶查詢：“200美元以下的防水徒步靴”

第一步（嵌入檢索）：返回100個(gè)結(jié)果，包括：

徒步靴（符合需求）；

雨靴（與“防水”語(yǔ)義相關(guān)）；

高價(jià)登山靴（與“徒步”相關(guān)）；

防水夾克（與“防水”語(yǔ)義重疊）。

第二步（關(guān)鍵詞過(guò)濾）：應(yīng)用BM25評(píng)分篩選：

品類匹配：“徒步靴”（剔除夾克、雨靴）；

價(jià)格約束：“<200美元”（剔除高價(jià)登山靴）；

功能匹配：“防水”（精確篩選功能）。

最終結(jié)果：15款符合預(yù)算、功能與品類需求的防水徒步靴。

案例2：襪子搜索

用戶查詢：“跑步用美利奴羊毛襪”

第一步（嵌入檢索）：返回結(jié)果包括：

美利奴羊毛保暖內(nèi)衣（材質(zhì)匹配）；

跑鞋（場(chǎng)景匹配）；

棉質(zhì)運(yùn)動(dòng)襪（場(chǎng)景+品類匹配）；

羊毛毛衣（材質(zhì)匹配）。

第二步（關(guān)鍵詞過(guò)濾）：

品類精確匹配：“襪子”（剔除內(nèi)衣、跑鞋、毛衣）；

材質(zhì)約束：“美利奴”或“羊毛”；

場(chǎng)景約束：“跑步”或“運(yùn)動(dòng)”。

最終結(jié)果：精準(zhǔn)匹配“跑步場(chǎng)景”與“美利奴羊毛材質(zhì)”的襪子。

3. 混合搜索的核心優(yōu)勢(shì)

精準(zhǔn)度與召回率平衡：嵌入檢索“廣撒網(wǎng)”，避免因詞匯差異遺漏相關(guān)結(jié)果；關(guān)鍵詞過(guò)濾“精準(zhǔn)篩選”，剔除噪聲。
貼合用戶意圖：電商用戶的需求往往兼具“概念性”（如“防水鞋”）與“明確約束”（如品牌、價(jià)格），混合策略可同時(shí)滿足這兩類需求。
計(jì)算效率優(yōu)化：只需一次高成本的嵌入檢索，后續(xù)通過(guò)低成本的文本過(guò)濾即可優(yōu)化結(jié)果，無(wú)需反復(fù)嵌入子查詢。
品類化優(yōu)化：在時(shí)尚、服飾等領(lǐng)域，顏色、尺寸、材質(zhì)等屬性比語(yǔ)義相似性更重要。例如用戶搜索“紅色襪子”，需要的是“紅色”而非“酒紅色長(zhǎng)襪”——關(guān)鍵詞過(guò)濾可確保屬性精準(zhǔn)。

4. 智能體RAG中的混合搜索落地

在智能體系統(tǒng)中，混合搜索的價(jià)值進(jìn)一步放大——智能體可根據(jù)查詢分析，動(dòng)態(tài)調(diào)整嵌入與關(guān)鍵詞的權(quán)重：

對(duì)于“探索性查詢”（如“如何選擇徒步靴”）：更多依賴嵌入檢索，獲取廣泛信息；
對(duì)于“特定產(chǎn)品查詢”（如“Nike Air Max 10碼”）：強(qiáng)化關(guān)鍵詞過(guò)濾，確保精準(zhǔn)；
對(duì)于“多約束查詢”（如“200美元以下防水徒步靴”）：先用嵌入檢索鎖定“徒步靴”品類，再用關(guān)鍵詞滿足價(jià)格、功能約束。

這種分層策略讓RAG從“簡(jiǎn)單檢索工具”升級(jí)為“智能搜索協(xié)調(diào)者”——既能理解語(yǔ)義，又能保證精準(zhǔn)，完美匹配現(xiàn)代應(yīng)用的需求。

四、總結(jié)

簡(jiǎn)單RAG與智能體RAG各有優(yōu)勢(shì)，適用于不同場(chǎng)景，選擇的核心在于匹配應(yīng)用需求：

簡(jiǎn)單RAG：在速度與簡(jiǎn)潔性優(yōu)先的場(chǎng)景中表現(xiàn)突出，例如實(shí)時(shí)聊天機(jī)器人、語(yǔ)音問(wèn)答。以面向用戶的客服應(yīng)用為例，低延遲是避免用戶 frustration 的關(guān)鍵，簡(jiǎn)單RAG的“一次性檢索”能以最小計(jì)算成本提供快速響應(yīng)。
智能體RAG：在召回率與精準(zhǔn)度至關(guān)重要的領(lǐng)域（如企業(yè)級(jí)應(yīng)用、政府系統(tǒng)）更具優(yōu)勢(shì)。其迭代循環(huán)與混合搜索能力可確保輸出精準(zhǔn)且經(jīng)過(guò)驗(yàn)證，尤其適合需要深度推理或動(dòng)態(tài)數(shù)據(jù)整合的復(fù)雜查詢。

理解兩者的權(quán)衡（速度與深度、簡(jiǎn)潔與精準(zhǔn)）后，AI工程師才能選擇合適的方案，在滿足具體需求的同時(shí)，推動(dòng)智能自動(dòng)化的邊界。你對(duì)這兩種RAG方案有何看法？

責(zé)任編輯：武曉燕來(lái)源：大模型之路

RAG AI 機(jī)器人

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<del id="1hdse"><mark id="1hdse"></mark></del>

<nav id="1hdse"><fieldset id="1hdse"></fieldset></nav>