優(yōu)秀Agent智能體必學(xué)的幾種設(shè)計模式,一學(xué)就會
大家好,我是老渡。
昨天在公司聽了清華大學(xué)智能產(chǎn)業(yè)研究院現(xiàn)場分享的AI醫(yī)院小鎮(zhèn)。
圖片
這是一個虛擬世界,所有的醫(yī)生、護士、患者都是由LLM驅(qū)動的Agent智能體,可以自主交互。它們模擬了整個診病看病的過程,在涵蓋主要呼吸道疾病的MedQA數(shù)據(jù)集子集上,實現(xiàn)高達93.06%的最新準(zhǔn)確率。
一個優(yōu)秀的智能體,離不開優(yōu)秀的設(shè)計模式。看完這個案例,我趕緊拜讀了吳恩達老師最近發(fā)表的 4 種主要的Agent設(shè)計模式。
吳恩達是人工智能和機器學(xué)習(xí)領(lǐng)域國際上最權(quán)威的學(xué)者之一
然后,趕緊整理出來,跟大家分享一下。
模式一、反思(Reflection)
在這個模式里大模型第一次生成的結(jié)果并不直接輸出,而是把結(jié)果重新丟給大模型讓其檢查、評估。
它會得出第二版本的結(jié)果,而這個版本的結(jié)果可能比第一版本工作得更好。
用孔子的話說這叫“吾日三省吾身”。
在這個模式里編寫的具體Prompt可以運用我們之前分享幾個推理模式,如:少樣本(Few-shot)、思維鏈(CoT)、思維樹(ToT)、ReAct等等。
這一模式的核心目的是,在不借助外力的情況下,將大模型的推理能力盡可能發(fā)揮到極致。
模式二、工具使用(Tool Use)
這一模式是讓智能體能夠利用外部工具執(zhí)行特定的任務(wù)。
說白了就是“搖人,專業(yè)事交給專業(yè)人”。
大模型本質(zhì)是文本預(yù)測,并沒有算數(shù)、執(zhí)行代碼等能力。遇到這些任務(wù),我們可以讓大模型生成式子、代碼,然后調(diào)用計算器、代碼解釋器來完成。
這個模式的Agent有了外力的幫助,似乎可以變得更強大了。
模式三、規(guī)劃(Planning)
這種模式是讓智能體將一個復(fù)雜任務(wù)分解成一系列簡單的小任務(wù),然后逐一解決。
其實就是“要把大象放冰箱,攏共分幾步”,剛聽到這個問題是一臉懵逼,但當(dāng)看到下圖的時候,一下子就豁然開朗了。
圖片
模式四、多智能體協(xié)作(Multiagent Collaboration)
上一個模式的Agent將復(fù)雜任務(wù)拆解之后,自然而然就需要多個Agent各司其職,相互協(xié)作,共同完成復(fù)雜的任務(wù)。
圖片
之前我們分享過一個開源AI程序員GPT Pilot,他的設(shè)計思路就是多Agent模式,模擬了產(chǎn)品經(jīng)理、架構(gòu)師、程序員、測試各種角色,完成軟件開發(fā)任務(wù)。
文章開頭介紹的AI醫(yī)院小鎮(zhèn)也是這個模式,后續(xù)我也會分享這個模式的實踐案例。