從RAG到Agent,是AI知識(shí)探索的內(nèi)卷與進(jìn)化

“哥,又來活了。”
剛?cè)肼殘?chǎng)的AI“實(shí)習(xí)生”小R,一臉興奮地看著我,手里捧著一堆剛從網(wǎng)上扒下來的資料。
這是老板剛丟過來的需求:“小R,幫我查查最近三年,Transformer模型在降本增效上,都有哪些新花樣?”
小R,全名RAG(
Retrieval-Augmented Generation),是我們團(tuán)隊(duì)的“超級(jí)實(shí)習(xí)生”。他有個(gè)絕活,就是能把問題和他那“博聞強(qiáng)記”的外部知識(shí)庫結(jié)合起來,生成看起來頭頭是道的答案。自從他來了之后,那些“我們公司最新的報(bào)銷政策是啥?”或者“A產(chǎn)品的技術(shù)文檔在哪?”之類的基礎(chǔ)問題,再也不用我們這些“老油條”親自出馬了。
但這次,小R似乎遇到了點(diǎn)麻煩...
RAG:AI界的“超級(jí)實(shí)習(xí)生”,聽話能干但有點(diǎn)“傻”
小R的工作模式,說白了就三步:檢索、增強(qiáng)、生成。
接到任務(wù)后,他會(huì)先把老板的問題(Query)“翻譯”成計(jì)算機(jī)能懂的語言(向量),然后去他的“記憶宮殿”(向量數(shù)據(jù)庫)里,把所有相關(guān)的資料(Documents)都找出來。
最后,他會(huì)把問題和這些資料一股腦兒地塞給大腦(LLM),讓大腦生成最終的答案。

這套流程,在處理簡(jiǎn)單問題時(shí),簡(jiǎn)直是“降維打擊”。比如你問他“蘋果最新的操作系統(tǒng)是啥?”,他能精準(zhǔn)地告訴你iOS的最新版本,而不是給你推薦一斤紅富士。
但面對(duì)老板那個(gè)“Transformer降本增效”的復(fù)雜問題,小R的“傻”就暴露無遺了。他吭哧吭哧地從知識(shí)庫里拖出了一大堆文檔,從2017年的“Attention Is All You Need”到最新的各種變體,一股腦地堆在我面前。
“哥,都在這了,您看?”
我看著那長(zhǎng)長(zhǎng)的文檔列表,頭都大了。這不叫“總結(jié)”,這叫“資料搬運(yùn)”。
小R就像一個(gè)只會(huì)用Ctrl+C和Ctrl+V的實(shí)習(xí)生,雖然聽話能干,但你讓他做點(diǎn)需要?jiǎng)幽X子的分析,他就“死機(jī)”了。
他不知道哪些是重點(diǎn),哪些是噪音,更不知道如何從這些雜亂無章的信息中,提煉出老板真正想要的“新花樣”。
這就是RAG的困境:一次性、靜態(tài)的檢索,讓它在面對(duì)復(fù)雜、多層次的問題時(shí),顯得力不從心。 他能給你魚,但不會(huì)教你釣魚,更不會(huì)幫你把魚做成一桌好菜。
DeepSearch:給實(shí)習(xí)生“加餐”,從“搬磚”到“分析”
“小R,你這樣不行啊?!蔽艺Z重心長(zhǎng)地對(duì)他說,“老板要的是‘新花樣’,你得有自己的分析和判斷。”
為了讓小R“開竅”,我們給他請(qǐng)了個(gè)“私教”,名叫DeepSearch。

DeepSearch的到來,給小R的工作流程帶來了革命性的變化。他不再是那個(gè)只會(huì)“一把梭”的愣頭青,而是學(xué)會(huì)了“三思而后行”。
面對(duì)同樣的問題,DeepSearch會(huì)先引導(dǎo)小R把問題拆解成幾個(gè)小目標(biāo):
第一步: 先搞清楚“Transformer效率優(yōu)化”有哪些主流方向?
第二步: 找到“2024年”的最新研究成果。
第三步: 聚焦到“計(jì)算成本降低”這個(gè)具體的技術(shù)點(diǎn)上。
這種分階段檢索的機(jī)制,直接給小R裝上了一個(gè)“導(dǎo)航系統(tǒng)”,讓他不再會(huì)迷失在信息的海洋里。
更絕的是,DeepSearch還教會(huì)了小R一個(gè)新技能:邊生成邊檢索。在寫報(bào)告的過程中,如果發(fā)現(xiàn)某個(gè)知識(shí)點(diǎn)有缺失,比如“稀疏化技術(shù)”的最新進(jìn)展沒覆蓋到,他會(huì)立刻停下來,啟動(dòng)一輪新的、針對(duì)性的檢索,把信息補(bǔ)全。
這還沒完。
在DeepSearch的“調(diào)教”下,小R還學(xué)會(huì)了和團(tuán)隊(duì)里的其他“人”協(xié)同作戰(zhàn)。比如,他會(huì)先讓“問題規(guī)劃Agent”把任務(wù)拆解好,然后讓“搜索Agent”去執(zhí)行檢索,再讓“閱讀Agent”提取關(guān)鍵信息,最后自己(推理Agent)再把這些信息整合起來,生成最終的結(jié)論。
這套組合拳下來,小R的產(chǎn)出質(zhì)量,直接上了一個(gè)臺(tái)階。他交上來的報(bào)告,不再是簡(jiǎn)單的資料羅列,而是有了初步的結(jié)構(gòu)和分析。老板看了之后,滿意地點(diǎn)了點(diǎn)頭:“嗯,有點(diǎn)意思了。”
根據(jù)阿里云的測(cè)試,在處理3跳以上的多層次問題時(shí),DeepSearch的檢索召回率比傳統(tǒng)RAG高出40%以上。
這背后,是對(duì)“檢索質(zhì)量”和“生成負(fù)擔(dān)”之間平衡的精準(zhǔn)拿捏。通過動(dòng)態(tài)篩選最相關(guān)的信息,DeepSearch讓大模型能把寶貴的計(jì)算資源,集中在知識(shí)整合上,而不是信息篩選上。
DeepResearch:當(dāng)“實(shí)習(xí)生”學(xué)會(huì)了“獨(dú)立思考”
秘塔AI的【深度研究】模式,相當(dāng)于DeepResearch,如下圖所示:

就在我們以為小R已經(jīng)“學(xué)成出師”的時(shí)候,一個(gè)新的挑戰(zhàn)又來了。老板說:“光有分析還不夠,我需要一份關(guān)于這個(gè)主題的深度研究報(bào)告,要有洞察,有觀點(diǎn),能直接拿去給客戶看的。”
這次,連DeepSearch都覺得有點(diǎn)棘手了。他能幫小R找到答案,但無法憑空創(chuàng)造出“洞察”和“觀點(diǎn)”。
于是,我們迎來了終極進(jìn)化體:DeepResearch。
如果說DeepSearch是小R的“研究助理”,那DeepResearch就是能獨(dú)立帶項(xiàng)目的“初級(jí)研究員”。他的出現(xiàn),讓小R的工作,從“信息檢索”直接躍遷到了“知識(shí)創(chuàng)造”。
DeepResearch的工作流程,完全模擬了一個(gè)人類研究員:
1. 理解研究目標(biāo): 他會(huì)先和老板反復(fù)確認(rèn),到底想要什么樣的報(bào)告。
2. 規(guī)劃研究步驟: 然后,他會(huì)自己制定一個(gè)詳細(xì)的研究計(jì)劃,精確到每天要看哪些論文,分析哪些數(shù)據(jù)。
3. 搜集多元信息: 他不再局限于公司內(nèi)部的知識(shí)庫,而是會(huì)主動(dòng)去網(wǎng)上搜尋最新的論文、技術(shù)博客、甚至是行業(yè)報(bào)告。
4. 交叉驗(yàn)證: 他會(huì)像一個(gè)嚴(yán)謹(jǐn)?shù)膶W(xué)者一樣,對(duì)比不同來源的信息,如果發(fā)現(xiàn)沖突,會(huì)標(biāo)記出來,并優(yōu)先采信更權(quán)威的來源。
5. 綜合分析與報(bào)告生成: 最后,他會(huì)把所有的研究成果,整合成一份結(jié)構(gòu)完整、邏輯清晰、包含摘要、方法、結(jié)果、討論的深度報(bào)告,甚至能直接導(dǎo)出到Notion或Obsidian里。
前段時(shí)間,有個(gè)同事讓他研究“近五年機(jī)器學(xué)習(xí)在金融風(fēng)控中的應(yīng)用進(jìn)展”。DeepResearch只花了半個(gè)小時(shí),就交出了一份堪比專業(yè)分析師水準(zhǔn)的綜述報(bào)告。而這項(xiàng)工作,如果讓人來做,沒幾天時(shí)間根本下不來。
DeepResearch的強(qiáng)大,源于其Agentic AI的內(nèi)核。
他不再是一個(gè)被動(dòng)的工具,而是一個(gè)擁有自主規(guī)劃、執(zhí)行、反思、調(diào)整能力的“智能體”。他能在開放、真實(shí)的網(wǎng)絡(luò)環(huán)境中,像人類一樣自主地進(jìn)行研究,處理各種噪聲數(shù)據(jù),應(yīng)對(duì)信息缺失的挑戰(zhàn)。
結(jié)語
從RAG到DeepSearch,再到DeepResearch,我們看到了一條清晰的技術(shù)進(jìn)化路徑:從最開始聽話能干但有點(diǎn)“傻”的實(shí)習(xí)生,到能做分析、有條理的“研究助理”,再到能獨(dú)立思考、創(chuàng)造知識(shí)的“初級(jí)研究員”。
這背后,是AI知識(shí)探索領(lǐng)域的一場(chǎng)“內(nèi)卷”與“進(jìn)化”。
RAG解決了“有沒有”的問題,讓AI有了可靠的知識(shí)來源。
DeepSearch解決了“好不好”的問題,讓AI在復(fù)雜問題面前,能更聰明地找到答案。
DeepResearch則解決了“精不精”的問題,讓AI開始擁有了創(chuàng)造新知識(shí)的潛力。
未來,這三者之間的界限會(huì)越來越模糊。RAG會(huì)吸收DeepSearch的動(dòng)態(tài)檢索能力,DeepResearch的核心組件也會(huì)被模塊化,融入到更廣泛的AI應(yīng)用中。
但無論技術(shù)如何演進(jìn),其最終的目標(biāo),都不是為了取代我們,而是成為我們的“認(rèn)知放大器”——將我們從重復(fù)、繁瑣的知識(shí)搬運(yùn)工作中解放出來,讓我們能專注于那些真正需要?jiǎng)?chuàng)造力、洞察力和同理心的工作。
你,覺得呢~




































