Agent不是被卡住了,其實在思考
在與用戶進行自然對話時,智能體承擔(dān)著兩大核心任務(wù):一是流暢的對話交流,二是精準(zhǔn)的推理與規(guī)劃。智能體必須整合所有可用信息以作出回應(yīng),同時確保其行為始終圍繞既定目標(biāo)展開。
基于人類“快速思考”和“慢速思考”的認知系統(tǒng)靈感,丹尼爾·卡尼曼提出了一個全新的架構(gòu)Talker-Reasoner,旨在模擬人類的這兩種思維模式。
論文地址:
paper: https://arxiv.org/pdf/2410.08328
title: Agents Thinking Fast and Slow: A Talker-Reasoner Architecture Google DeepMind
代理被分為兩個部分:一個快速直觀的“Talker”代理(系統(tǒng)1)和一個慢速、深思熟慮的“Reasoner” 代理(系統(tǒng)2)。Talker代理負責(zé)與用戶進行自然語言對話,而Reasoner代理負責(zé)復(fù)雜的問題解決、信念形成和決策。兩者通過記憶進行交互。
圖片
- 快速響應(yīng)型的Talker組件(第一系統(tǒng)):它的主要職責(zé)是處理用戶的自然語言交互并生成相應(yīng)回復(fù)。這一組件類似于人類的本能反應(yīng),能夠快速從存儲系統(tǒng)中提取所需信息來支持對話。每當(dāng)用戶發(fā)起互動時,Talker組件就會被觸發(fā),并通過訪問存儲系統(tǒng)來指導(dǎo)其回應(yīng)過程。
- 深度思考型的Reasoner組件(第二系統(tǒng)):它專注于執(zhí)行需要深入思考的多步推理和規(guī)劃任務(wù)。該組件不僅負責(zé)調(diào)用各種工具和執(zhí)行具體操作,還要更新系統(tǒng)狀態(tài)。同時,它也承擔(dān)著構(gòu)建和更新用戶信念狀態(tài)的任務(wù),這些信息會以結(jié)構(gòu)化的語言形式保存在存儲系統(tǒng)中。
論文在睡眠輔導(dǎo)的現(xiàn)實世界場景中實例化并驗證了Talker-Reasoner雙代理架構(gòu)。這個案例研究允許定性測試Reasoner的規(guī)劃和推理能力以及Talker的互動性。
睡眠輔導(dǎo)智能系統(tǒng)案例分析
睡眠輔導(dǎo)智能系統(tǒng)的構(gòu)建:
- Talker智能體:利用專家提供的指導(dǎo)原則,編碼睡眠領(lǐng)域的專業(yè)知識。這些原則描述了智能體的特性(如表現(xiàn)同理心、進行對話交流、提供準(zhǔn)確建議)和睡眠輔導(dǎo)的各個階段(包括理解、目標(biāo)設(shè)定和輔導(dǎo)計劃)。Talker智能體基于強大的語言模型實現(xiàn),能夠理解復(fù)雜模式并生成深思熟慮的對話回應(yīng)。
- Reasoner智能體:專門對用戶信念進行建模。研究者與臨床專家合作,設(shè)計了一個JSON/XML格式的信念模式,涵蓋睡眠問題、目標(biāo)、習(xí)慣、障礙和睡眠環(huán)境等方面。在執(zhí)行多步推理/規(guī)劃時,Reasoner智能體推斷并更新這些模式字段,從而創(chuàng)建或修改其信念狀態(tài)。
- Talker和Reasoner的協(xié)作:Talker智能體是否等待Reasoner智能體完成操作,取決于當(dāng)前的信念狀態(tài)。在制定輔導(dǎo)計劃階段,Talker智能體會等待Reasoner智能體;其他情況下則不會等待。
定性分析結(jié)果:
- 對話示例:Talker和Reasoner智能體之間的互動過程,包括如何根據(jù)用戶需求生成回應(yīng)和制定計劃,以及如何根據(jù)用戶反饋調(diào)整方案。
- 基于反饋的計劃調(diào)整:Reasoner智能體如何根據(jù)Talker智能體從用戶處收集的反饋來優(yōu)化其計劃。
以下是一段示例對話,展示了Reasoner和Talker之間的互動:
用戶:嘿,我需要你的幫助來規(guī)劃如何營造一個放松的睡前環(huán)境。(記憶中的信念更新為:{updated-context: starting context, updated-title: Sleep Coaching, coachingphase: UNDERSTANDING})
Talker:太好了,我們開始為你打造一個放松的睡前環(huán)境吧:-) 你的臥室里有沒有什么可能會干擾你睡眠的東西?
用戶:我覺得噪音和光線太分散注意力了。你能幫我制定一個消除這些干擾的計劃嗎?(記憶中的信念保持不變)
Talker:當(dāng)然可以!這里有一個消除臥室干擾的計劃:噪音:確定噪音源,隔絕外界噪音,使用遮光窗簾來阻擋光線和減少噪音;考慮使用降噪窗簾或隔音板;試試耳塞或白噪音機。光線:...記住,一致性是關(guān)鍵。每晚都堅持這個計劃,以營造一個平靜而黑暗的睡眠環(huán)境。還有什么我可以幫助你的嗎?
用戶:當(dāng)然,這很有用。不過,我希望步驟能更詳細一些。還想看看如何在我的臥室里營造一個寧靜放松的氛圍的資源。(記憶中的信念更新為:{user context: UserCollectedContextData(primary-sleep-concern: Noise and light distractions in the bedroom), coaching phase: CoachingPhase(value=PLANNING)})
Reasoner的計劃:當(dāng)然!讓我們更深入地看看你的計劃的第一步:步驟:選擇一個平靜的色彩調(diào)色板。描述:在選擇臥室顏色時,選擇柔和的中性色調(diào),如柔和的藍色、綠色或灰色。這些色調(diào)已被科學(xué)證明可以促進放松和寧靜。1. YouTube視頻:(鏈接)標(biāo)題:創(chuàng)造放松和無壓力臥室的墻面顏色創(chuàng)意。頻道:roomdsignTV。推理:這個來自roomdsignTV的視頻提供了平靜臥室色彩調(diào)色板的視覺示例。它展示了舒緩色彩對營造寧靜氛圍的影響。2. YouTube播放列表:(鏈接)標(biāo)題:Berger油漆色彩組合。頻道:Hresun Interiors。推理:這個來自Hresun Interiors的播放列表提供了一系列的臥室色彩組合創(chuàng)意。它涵蓋了從傳統(tǒng)到現(xiàn)代的多種風(fēng)格,幫助你找到適合臥室的完美色彩方案。
Talker:復(fù)制Reasoner的回應(yīng)
如果對內(nèi)容有什么疑問和建議可以私信和留言,也可以添加我加入大模型交流群,一起討論大模型在創(chuàng)作、RAG和agent中的應(yīng)用。