吳恩達(dá)Agentic AI新課:手把手教你搭建Agent工作流,GPT-3.5反殺GPT-4就順手的事
吳恩達(dá)又出新課了,這次的主題是—Agentic AI。

在新課中,吳恩達(dá)將Agentic工作流的開(kāi)發(fā)沉淀為四大核心設(shè)計(jì)模式:反思、工具、規(guī)劃與協(xié)作,并首次強(qiáng)調(diào)評(píng)估與誤差分析才是智能體開(kāi)發(fā)的決定性能力:
誰(shuí)能建立起系統(tǒng)化的評(píng)估與誤差分析流程,持續(xù)定位并改進(jìn)智能體工作流中的問(wèn)題,誰(shuí)就在智能體開(kāi)發(fā)中領(lǐng)先一步。
在課程演示中,通過(guò)使用Agentic技巧,甚至可以讓GPT-3.5在編程任務(wù)中輕松秒殺GPT-4。

Agentic AI不再讓模型一次性“憋”出答案,而是學(xué)會(huì)拆解任務(wù)、反思結(jié)果、用工具修正偏差,并在多輪循環(huán)中不斷優(yōu)化。
這種更像人類(lèi)的工作流,讓它的表現(xiàn)遠(yuǎn)超傳統(tǒng)的端到端Agent。
想知道這是怎么做到的?來(lái),跟著吳老師無(wú)限進(jìn)步就完了!

Agentic AI:從“調(diào)模型”到“設(shè)計(jì)系統(tǒng)”
首先需要明確的一點(diǎn)是,與其說(shuō)這次的新課是吳恩達(dá)關(guān)于智能體開(kāi)發(fā)的技術(shù)教程,不如說(shuō)它是一門(mén)揭示Agentic AI背后系統(tǒng)性方法論的課程——
它關(guān)注的重點(diǎn),不是如何堆疊工作流界面,而是如何讓AI像人類(lèi)一樣,通過(guò)分解、執(zhí)行與優(yōu)化來(lái)解決復(fù)雜問(wèn)題。
其中,任務(wù)分解既是構(gòu)建Agentic工作流的起點(diǎn),也是持續(xù)改進(jìn)與優(yōu)化系統(tǒng)的前提。
例如,我們?cè)趯?xiě)論文時(shí),往往會(huì)先設(shè)計(jì)提綱,再查找資料、撰寫(xiě)初稿、反復(fù)修改。
AI同樣需要這樣的結(jié)構(gòu)化過(guò)程。
換句話說(shuō),寫(xiě)作這一任務(wù)本身就是由多個(gè)相互銜接的子任務(wù)組成的。
而Agentic的核心理念,就是讓大語(yǔ)言模型以多步推理與分階段執(zhí)行的方式工作,而非一次性生成結(jié)果。
那么,如何拆解復(fù)雜任務(wù)呢?
吳恩達(dá)在課程中指出,他通常會(huì)先分析一個(gè)現(xiàn)有流程,將其拆解為離散步驟,并思考哪些步驟可由大模型實(shí)現(xiàn)(例如通過(guò)調(diào)用 API 或工具)。
若模型暫時(shí)無(wú)法完成某一步,他會(huì)繼續(xù)將任務(wù)細(xì)化,直至能夠落地實(shí)現(xiàn)。
在獲得初始工作流后,接下來(lái)的關(guān)鍵是評(píng)估與改進(jìn)——分析系統(tǒng)性能、定位薄弱環(huán)節(jié),并不斷優(yōu)化迭代。這種以“分解—執(zhí)行—評(píng)估—優(yōu)化”為核心的循環(huán),正是Agentic的本質(zhì)與此次課程的關(guān)鍵。
接下來(lái),我們就來(lái)看吳恩達(dá)提出的四種Agentic設(shè)計(jì)模式。
首先是Reflection(反思)
反思的核心思想非常簡(jiǎn)單,就是讓大模型讓檢視自己的輸出結(jié)果,并思考如何改進(jìn)。
例如,我們可以讓模型先輸出一段代碼,然后將測(cè)試結(jié)果報(bào)給它,讓它在這個(gè)基礎(chǔ)上修改。

在這里,吳恩達(dá)在這里分享了自己利用反思方法的經(jīng)驗(yàn):
首先,他指出,可以不僅在單一大模型上進(jìn)行優(yōu)化,還可以讓兩個(gè)模型互相配合,通過(guò)“左右互搏”獲取更優(yōu)答案。
其中,使用具備推理能力的模型進(jìn)行反思,通常比非推理模型效果更佳,因此在設(shè)置生成與反思模型時(shí),可以嘗試不同的組合策略。
其次,在某些情況下,憑經(jīng)驗(yàn)或直覺(jué)難以判斷哪個(gè)輸出更優(yōu),這時(shí)就需要客觀的評(píng)估標(biāo)準(zhǔn)。
為此,可以人為設(shè)定量化評(píng)分機(jī)制,例如二元打分,讓大模型根據(jù)評(píng)分計(jì)算結(jié)果,從而獲得相對(duì)公正的評(píng)估。
最后,若能夠獲取外部反饋,其效果通常遠(yuǎn)超僅依賴(lài)模型自身的反思。

例如,可以提供參考答案或正確內(nèi)容,讓大語(yǔ)言模型參照這些信息進(jìn)行自我修正,從而顯著提升輸出質(zhì)量。
接下來(lái)是工具調(diào)用(Tool use)
與傳統(tǒng)硬編碼、固定的工作流不同,工具調(diào)用指的是由大語(yǔ)言模型驅(qū)動(dòng)的應(yīng)用能夠自主決定調(diào)用哪些功能,例如進(jìn)行網(wǎng)頁(yè)搜索、訪問(wèn)日歷、發(fā)送郵件或編寫(xiě)代碼等。
模型可以通過(guò)外部函數(shù),來(lái)實(shí)現(xiàn)相應(yīng)的請(qǐng)求。作為開(kāi)發(fā)者,可以提前集成多個(gè)工具,然后根據(jù)用戶(hù)請(qǐng)求,讓大語(yǔ)言模型調(diào)用。
在這里,吳恩達(dá)對(duì)比了傳統(tǒng)的工具調(diào)用流程和現(xiàn)在流行的MCP方法。
傳統(tǒng)流程中,開(kāi)發(fā)者需要先將工具提供給大語(yǔ)言模型,實(shí)現(xiàn)對(duì)應(yīng)函數(shù),并告知模型該工具可用。
當(dāng)大語(yǔ)言模型決定調(diào)用工具時(shí),它會(huì)生成特定輸出,提示開(kāi)發(fā)者調(diào)用該函數(shù),獲取結(jié)果后再反饋給模型,以便模型繼續(xù)執(zhí)行后續(xù)操作。
顯然,這種方式更像是開(kāi)發(fā)者在主動(dòng)調(diào)用工具,而非大模型自主執(zhí)行。
由于實(shí)際需求復(fù)雜且多樣,開(kāi)發(fā)者不可能為每個(gè)功能手動(dòng)實(shí)現(xiàn),最理想的方式是讓大模型能夠自主生成、調(diào)用并匹配工具。
為此,可以使用吳恩達(dá)及其團(tuán)隊(duì)開(kāi)發(fā)的AISuite開(kāi)源庫(kù),這一Python庫(kù)旨在簡(jiǎn)化大語(yǔ)言模型與多個(gè)提供商之間的集成,讓模型能夠自主調(diào)用工具。
值得注意的是,讓模型自行編寫(xiě)和調(diào)用代碼仍存在一定風(fēng)險(xiǎn)。
在測(cè)試中,吳恩達(dá)發(fā)現(xiàn)大語(yǔ)言模型偶爾會(huì)刪除代碼,因此建議在沙盒環(huán)境(如 Docker 或 e2b)中進(jìn)行操作,以確保安全和可控。
與此同時(shí),不同的開(kāi)發(fā)者可能都想讓AI或程序去操作Slack、GitHub、數(shù)據(jù)庫(kù)、云服務(wù)等來(lái)獲取數(shù)據(jù)或工具。
由于每個(gè)開(kāi)發(fā)者都獨(dú)立實(shí)現(xiàn)接口,寫(xiě)不同的API調(diào)用、認(rèn)證方式、數(shù)據(jù)解析,而這無(wú)異于重復(fù)造輪胎。
于是就出現(xiàn)了“統(tǒng)一協(xié)議”或“抽象層”的想法,例如Anthropic提出的MCP。

MCP/統(tǒng)一協(xié)議把散亂的工具調(diào)用從“各自為政”變成了“標(biāo)準(zhǔn)客戶(hù)端-服務(wù)器模式”,AI只需要像調(diào)用本地函數(shù)一樣調(diào)用服務(wù)端即可。

這極大地方便了當(dāng)下的智能體工具調(diào)用流程。
接下來(lái)是規(guī)劃(planning)。
在實(shí)際開(kāi)發(fā)中,如果每遇到一個(gè)請(qǐng)求就臨時(shí)補(bǔ)丁一個(gè)工具,不僅低效,而且難以形成可復(fù)用的流程。
因此,就需要規(guī)劃使大模型能夠根據(jù)不同請(qǐng)求,靈活調(diào)整工具序列的執(zhí)行順序,從而優(yōu)化性能與資源使用。
例如,出于成本和延遲的考慮,對(duì)于一些問(wèn)題,如果可以通過(guò)調(diào)用函數(shù)快速解決,就不必讓模型去執(zhí)行耗時(shí)的網(wǎng)頁(yè)搜索。
為實(shí)現(xiàn)這一點(diǎn),吳恩達(dá)分享了一個(gè)實(shí)用技巧:可以通過(guò)提示將執(zhí)行步驟轉(zhuǎn)化為JSON或代碼形式,將任務(wù)離散化,使模型能夠嚴(yán)格按照步驟執(zhí)行。
通過(guò)這種方式,Agent的任務(wù)執(zhí)行表現(xiàn)能夠得到顯著提升,同時(shí)也為后續(xù)的評(píng)估和優(yōu)化提供了清晰的操作軌跡。

最后是多智能體協(xié)作(Multi-agent collaboration)。
多智能體協(xié)作(Multi-agent Collaboration)指的是構(gòu)建多個(gè)具備不同專(zhuān)長(zhǎng)的智能體,共同完成復(fù)雜任務(wù),就如同一家公司雇傭多名員工,各司其職。
這個(gè)機(jī)制類(lèi)似于計(jì)算機(jī)中的多線程,能夠讓開(kāi)發(fā)者專(zhuān)注于某一個(gè)組件的優(yōu)化,同時(shí)讓其他智能體處理其余任務(wù),最后將各環(huán)節(jié)結(jié)果整合,從而提升整體效率和任務(wù)完成質(zhì)量。
此外,大語(yǔ)言模型不僅可以調(diào)用工具,還可以調(diào)用其他智能體,實(shí)現(xiàn)不同層級(jí)的嵌套調(diào)用。
這種結(jié)構(gòu)化協(xié)作方式類(lèi)似于企業(yè)中的組織架構(gòu),使復(fù)雜任務(wù)的分工與協(xié)作更加清晰、高效,同時(shí)也為工作流的可擴(kuò)展性和可維護(hù)性提供了保障。

除了以上的構(gòu)建模式,吳恩達(dá)還分享了構(gòu)建Agentic的實(shí)用技巧。
這里其實(shí)頗像強(qiáng)化學(xué)習(xí)里的采樣-評(píng)估-改進(jìn)的循環(huán)。

每一步智能體工作流的構(gòu)建,實(shí)際上都可以看作是一個(gè)閉環(huán)迭代反饋:
- Build / Sampling(采樣):首先搭建系統(tǒng)或工作流,讓模型在不同任務(wù)或請(qǐng)求上嘗試執(zhí)行,收集輸出結(jié)果。
- Evaluation/Analyze(評(píng)估):對(duì)輸出進(jìn)行分析,既有端到端的整體評(píng)估,也有組件級(jí)別的精細(xì)評(píng)估,快速定位錯(cuò)誤來(lái)源。
- Improvement(改進(jìn)):根據(jù)評(píng)估結(jié)果優(yōu)化流程或組件,調(diào)整參數(shù)、替換模塊、改進(jìn)提示詞或拆分步驟,然后進(jìn)入下一輪循環(huán)。
通過(guò)這種循環(huán),Agentic AI不斷迭代升級(jí),就像強(qiáng)化學(xué)習(xí)中的智能體通過(guò)反復(fù)試驗(yàn)和反饋,逐步提高策略效果。
不同的是,這里的“策略”是工作流和組件設(shè)計(jì),即通過(guò)反思、工具調(diào)用、規(guī)劃與多智能體協(xié)作等agentic工作流,實(shí)現(xiàn)任務(wù)拆分、組件優(yōu)化與迭代改進(jìn),從而讓AI系統(tǒng)在復(fù)雜場(chǎng)景中高效執(zhí)行、持續(xù)進(jìn)化。
具體來(lái)說(shuō),錯(cuò)誤評(píng)估既有端到端的輸入輸出評(píng)估,也有組件級(jí)別的評(píng)估,而組件級(jí)別的評(píng)估可以更快的找到具體出現(xiàn)錯(cuò)誤的地方,從而集中精力更好、更快的改進(jìn)系統(tǒng)。
在構(gòu)建Agentic工作流時(shí),收集和分析錯(cuò)誤是優(yōu)化系統(tǒng)的核心環(huán)節(jié)。
這里所指的錯(cuò)誤,是指某一步輸出的結(jié)果明顯低于人類(lèi)專(zhuān)家在相同輸入下的表現(xiàn)。
為此,可以通過(guò)追蹤中間執(zhí)行軌跡來(lái)定位問(wèn)題所在的環(huán)節(jié)。
比如,如果提示詞本身沒(méi)有問(wèn)題,但網(wǎng)頁(yè)搜索結(jié)果出現(xiàn)垃圾信息,則問(wèn)題可能出在大語(yǔ)言模型調(diào)用搜索工具的環(huán)節(jié)。
如果PDF轉(zhuǎn)文檔出現(xiàn)錯(cuò)誤,則需要檢查大語(yǔ)言模型的識(shí)別和提取模塊是否存在問(wèn)題。
這種評(píng)估既可以依賴(lài)人工完成,也可以通過(guò)大語(yǔ)言模型輔助加速。
例如,可以創(chuàng)建高可信度的信源清單,或者編寫(xiě)能夠多方求證的工具,從而提高組件級(jí)評(píng)估的效率。
接下來(lái),通過(guò)組件級(jí)評(píng)估,可以針對(duì)特定環(huán)節(jié)進(jìn)行優(yōu)化:調(diào)整組件參數(shù),例如修改RAG搜索范圍(按時(shí)間、類(lèi)別等);替換組件,包括函數(shù)或工具;改進(jìn)大模型組件,例如優(yōu)化提示詞、嘗試不同模型、拆分流程或進(jìn)行微調(diào)。
在更換或選擇大模型組件時(shí),吳恩達(dá)提供了一些自己的實(shí)踐直覺(jué):
首先,多嘗試不同模型,準(zhǔn)備多種測(cè)試問(wèn)題以評(píng)估性能。
其次,參考他人如何編寫(xiě)提示詞,并以此鍛煉自身提示詞設(shè)計(jì)能力。
最后,將不同模型應(yīng)用于工作流中,觀察其在各個(gè)步驟的表現(xiàn),從而不斷迭代和提升整個(gè)系統(tǒng)的可靠性與效率。
以上就是吳恩達(dá)課程的粗略梳理,課程全集可在Deeplearning.AI上訂閱收聽(tīng)。
為什么是Agentic而不是Agent
對(duì)于到底是Agent還是Agentic,早在去年年初,吳恩達(dá)就提出了自己極具前瞻性的思考:Agentic作為形容詞,而非二元分類(lèi),表示系統(tǒng)在智能體特性(自主性)上的不同程度。
這一表述在當(dāng)時(shí)有助于厘清概念,使開(kāi)發(fā)者和研究者能夠更準(zhǔn)確地理解和描述系統(tǒng)在智能體能力上的連續(xù)性,而不是將其簡(jiǎn)單地劃為“是”或“不是”。

而在此次的課程中,我們又可以進(jìn)一步的窺見(jiàn)其思考的加深:Agentic的意思是一個(gè)基于大語(yǔ)言模型(大語(yǔ)言模型)的應(yīng)用程序執(zhí)行多個(gè)步驟來(lái)完成一項(xiàng)任務(wù)。
與傳統(tǒng)的Agent相比,這里的關(guān)鍵區(qū)別在于任務(wù)執(zhí)行方式:傳統(tǒng)Agent往往是端到端操作——用戶(hù)制定一個(gè)prompt,大語(yǔ)言模型 返回一個(gè)輸出——而這種方式很少與人類(lèi)的工作方式契合,AI亦然。
在課程中,吳恩達(dá)表示:Agentic AI通過(guò)將任務(wù)拆分為多個(gè)步驟,逐步推進(jìn),每一步都經(jīng)過(guò)處理和優(yōu)化,從而顯著優(yōu)于一次性輸出答案的端到端Agent。
就像我們開(kāi)頭提到的GPT3.5戰(zhàn)勝GPT-4的例子。
因此,學(xué)習(xí)如何將復(fù)雜任務(wù)分解為步驟,并構(gòu)建組件高效執(zhí)行每一步,是一項(xiàng)復(fù)雜但至關(guān)重要的技能,這正決定了開(kāi)發(fā)者能否在各種應(yīng)用場(chǎng)景中構(gòu)建高效的代理型工作流。
更進(jìn)一步,對(duì)于端到端的Agent,留給開(kāi)發(fā)者優(yōu)化流程的空間實(shí)際上非常有限。
我們無(wú)法通過(guò)設(shè)計(jì)和改進(jìn)工作流來(lái)提升任務(wù)表現(xiàn),只能依賴(lài)prompt的優(yōu)化、模型能力的提升,甚至完全寄希望于模型本身。
而通過(guò)拆分組件、逐步優(yōu)化,每個(gè)環(huán)節(jié)都可迭代改進(jìn),從而讓系統(tǒng)持續(xù)進(jìn)化,這正是Agentic AI的優(yōu)勢(shì)所在。
值得一提的是,當(dāng)吳恩達(dá)首次提出“Agentic”這個(gè)術(shù)語(yǔ),原本是為了描述基礎(chǔ)應(yīng)用開(kāi)發(fā)中快速增長(zhǎng)的重要趨勢(shì),但沒(méi)想到市場(chǎng)營(yíng)銷(xiāo)人員將其廣泛用作標(biāo)簽,使Agentic AI炒作迅速升溫。
盡管如此,吳恩達(dá)表示,在實(shí)際應(yīng)用中Agentic的方法論仍然發(fā)揮著實(shí)際價(jià)值,為開(kāi)發(fā)者提供了可落地、可優(yōu)化的路徑。
在當(dāng)下,除了成熟的代碼Agent之外,基于步驟的Agentic AI仍有廣闊的發(fā)展空間。
這為開(kāi)發(fā)者探索更復(fù)雜、更智能的多步驟工作流提供了豐富機(jī)會(huì),也體現(xiàn)了課程的核心理念:通過(guò)拆解任務(wù)、構(gòu)建組件、逐步優(yōu)化,讓AI系統(tǒng)真正實(shí)現(xiàn)高效、可控的代理型流程。




































