吳恩達(dá)深度剖析:AI Agent 工作流的演進(jìn)與前景 精華
AI Agent 作為具備感知環(huán)境、做出決策和執(zhí)行動作能力的智能實體,正在成為人工智能領(lǐng)域的關(guān)鍵發(fā)展動向。
隨著大型語言模型(LLM)技術(shù)的持續(xù)進(jìn)步,AI Agent 的潛力正被逐步揭示,它們不僅能夠完成基于指令的任務(wù),還能表現(xiàn)出更高水平的自主性和主動性。
在最近的紅杉 AI Ascent 2024 活動中,人工智能領(lǐng)域的杰出人物吳恩達(dá)教授發(fā)表了一場關(guān)于 AI Agent 的富有洞見的演講。他深入探討了 AI Agent 的最新發(fā)展趨勢和設(shè)計模式,為參與者提供了關(guān)于人工智能未來方向的深入理解。
AI Agent 工作流的效果
吳恩達(dá)教授在演講中著重指出,AI Agent 正在引領(lǐng)工作流程的革新。與傳統(tǒng)的工作流程不同,AI Agent 通過迭代和對話式的模式工作,不再是簡單的指令執(zhí)行者,而是能夠進(jìn)行自我反思、規(guī)劃和修正的參與者。
在傳統(tǒng)的工作流程中,用戶向 AI Agent 模型輸入指令,模型生成回答,這種方式類似于要求人類專家連續(xù)不斷地完成任務(wù),沒有提供反思和修正的空間。

相對而言,AI Agent 的代理工作流是一個動態(tài)的、迭代的過程。AI Agent 首先接收一個大致的任務(wù),然后制定工作計劃,執(zhí)行任務(wù),并在每一步中進(jìn)行自我評估和修正。
這種工作流程類似于人類在寫作、編程或其他創(chuàng)造性任務(wù)中的思考過程,允許 AI Agent 通過不斷的迭代來提升工作成果的質(zhì)量。例如,AI Agent 可能會先創(chuàng)建一個草稿,然后審查和修改,這個過程可能會重復(fù)多次,直到達(dá)到滿意的結(jié)果。
吳恩達(dá)教授通過案例研究展示了 AI Agent 代理工作流在編程任務(wù)中的實際效果。使用代理工作流的 AI Agent 能夠生成更高質(zhì)量的代碼,并在遇到錯誤時自我修正,這種工作流不僅提升了代碼的準(zhǔn)確性,還減少了人為干預(yù)的需求。

吳恩達(dá)教授團(tuán)隊分析了一個叫做"人工評估基準(zhǔn)測試"的編碼基準(zhǔn)數(shù)據(jù),它包含諸如"給定一個非空整數(shù)列表,返回所有偶數(shù)位置元素的和"之類的編碼問題?,F(xiàn)有的做法是使用零樣本提示,即直接讓人工智能編寫代碼并運行,但沒有人是這樣編碼的。

研究發(fā)現(xiàn),GPT-3.5 使用零樣本提示時只有 48% 的正確率,GPT-4 提高到了 67%。但如果在 GPT-3.5 上使用一個代理工作流程,它的表現(xiàn)實際上比 GPT-4 還要好。如果在 GPT-4 上使用代理工作流程,它的表現(xiàn)也非常出色。這意味著采用代理工作流程對于構(gòu)建應(yīng)用程序至關(guān)重要。
四種 AI Agent 設(shè)計模式
吳恩達(dá)教授還提到了 AI Agent 的四種關(guān)鍵設(shè)計模式,它們是實現(xiàn)其高效執(zhí)行復(fù)雜任務(wù)的基礎(chǔ)。這些模式包括反思(Reflection)、工具使用(Tool Use)、規(guī)劃(Planning)和多智能體協(xié)作(Multiagent Collaboration),共同構(gòu)成了 AI Agent 的能力框架。
1. 反思

反思(Reflection)允許 AI Agent 在完成任務(wù)后,能夠?qū)ψ陨淼妮敵鲞M(jìn)行再次審視和評估。在這種模式下,AI Agent 不僅僅是執(zhí)行任務(wù),而是能夠像人類專家一樣,對自己的工作進(jìn)行批判性思考。
例如,AI Agent 可能會生成一段代碼,然后根據(jù)預(yù)設(shè)的標(biāo)準(zhǔn)或反饋,自我檢查代碼的正確性、效率和結(jié)構(gòu),并提出可能的改進(jìn)措施。這種自我監(jiān)督和修正的能力,使得AI Agent在執(zhí)行任務(wù)時能夠不斷提高準(zhǔn)確性和效率。
2. 工具使用

工具使用(Tool Use)賦予 AI Agent 使用外部工具和資源的能力,以此來擴(kuò)展其功能和提高生產(chǎn)效率。
這種模式下,AI Agent 可以搜索網(wǎng)頁、生成和運行代碼、分析數(shù)據(jù)等,利用各種工具來收集信息、執(zhí)行操作。
例如,AI Agent 可能會使用圖像處理工具來分析和處理圖像數(shù)據(jù),或者調(diào)用 API 來獲取和整合外部信息。這樣的能力使得 AI Agent 不再局限于其內(nèi)置的知識庫,而是能夠與外部系統(tǒng)交互,從而更好地適應(yīng)多變的任務(wù)需求。
3. 規(guī)劃

規(guī)劃(Planning)強(qiáng)調(diào) AI Agent 在面對復(fù)雜任務(wù)時,能夠進(jìn)行系統(tǒng)性的規(guī)劃和步驟分解。AI Agent 不僅能夠理解任務(wù)的整體目標(biāo),還能夠制定出詳細(xì)的行動計劃,并按照計劃逐步推進(jìn)任務(wù)的完成。
這種模式下,AI Agent 能夠展現(xiàn)出類似于人類的前瞻性和策略性思維。例如,AI Agent 可能會在進(jìn)行項目管理時,先確定項目的主要里程碑,然后為每個里程碑制定具體的執(zhí)行步驟和時間表,確保項目能夠有序進(jìn)行。
4. 多智能體協(xié)作

多智能體協(xié)作(Multiagent Collaboration)突出了多個 AI Agent 之間的合作和協(xié)調(diào)。在這種模式下,每個 AI Agent 都可以扮演特定的角色,并與其他 AI Agent 共同協(xié)作以完成復(fù)雜的任務(wù)。
這種合作可以模擬真實世界中的團(tuán)隊工作流程,通過代理間的互補(bǔ)和協(xié)同作用,提高整體的執(zhí)行效率和創(chuàng)新能力。
例如,在一個開源軟件開發(fā)項目中,一個 AI Agent 可能負(fù)責(zé)編寫代碼,而另一個 AI Agent 則負(fù)責(zé)代碼審查和測試,通過這樣的分工合作,共同推動項目的成功完成。
總結(jié)
這些模式的結(jié)合使用,不僅提升了 AI Agent 在單個任務(wù)中的執(zhí)行能力,還為其在更廣泛的應(yīng)用場景中進(jìn)行協(xié)作和創(chuàng)新提供了可能。隨著這些模式的進(jìn)一步發(fā)展和完善,AI Agent 將在未來的工作流程中發(fā)揮更加關(guān)鍵的作用,推動各行各業(yè)向智能化轉(zhuǎn)型。
AI Agent 的代理工作流在多個行業(yè)中展現(xiàn)出其實際應(yīng)用的巨大潛力。吳恩達(dá)教授提到了這些智能體在編程、研究和多模態(tài)任務(wù)處理等領(lǐng)域的應(yīng)用。
在演講中,吳恩達(dá)教授采用了 "Agentic Reasoning" 作為主題,這一概念可以翻譯為“代理性推理”。它指的是 AI Agent 在執(zhí)行任務(wù)時所采用的一種推理方式,涉及自主性、目標(biāo)導(dǎo)向和問題解決的能力。
代理性推理強(qiáng)調(diào) AI Agent 不僅僅是對輸入做出反應(yīng),而是能夠主動地進(jìn)行思考、規(guī)劃和決策,以實現(xiàn)特定的目標(biāo)或應(yīng)對復(fù)雜的問題。這種推理方式使得 AI Agent 更加類似于一個自主行動的智能體,能夠在多變的環(huán)境中靈活地執(zhí)行任務(wù)。由此可見,AI Agent 的下一步發(fā)展或許才是真正意義上的智能體。
本文轉(zhuǎn)載自??AI探索者知白??,作者:知白


















