Agent不是被卡住了,其實(shí)在思考
在與用戶進(jìn)行自然對話時(shí),智能體承擔(dān)著兩大核心任務(wù):一是流暢的對話交流,二是精準(zhǔn)的推理與規(guī)劃。智能體必須整合所有可用信息以作出回應(yīng),同時(shí)確保其行為始終圍繞既定目標(biāo)展開。
基于人類“快速思考”和“慢速思考”的認(rèn)知系統(tǒng)靈感,丹尼爾·卡尼曼提出了一個(gè)全新的架構(gòu)Talker-Reasoner,旨在模擬人類的這兩種思維模式。

論文地址:
paper: https://arxiv.org/pdf/2410.08328
title: Agents Thinking Fast and Slow: A Talker-Reasoner Architecture Google DeepMind代理被分為兩個(gè)部分:一個(gè)快速直觀的“Talker”代理(系統(tǒng)1)和一個(gè)慢速、深思熟慮的“Reasoner” 代理(系統(tǒng)2)。Talker代理負(fù)責(zé)與用戶進(jìn)行自然語言對話,而Reasoner代理負(fù)責(zé)復(fù)雜的問題解決、信念形成和決策。兩者通過記憶進(jìn)行交互。
圖片
- 快速響應(yīng)型的Talker組件(第一系統(tǒng)):它的主要職責(zé)是處理用戶的自然語言交互并生成相應(yīng)回復(fù)。這一組件類似于人類的本能反應(yīng),能夠快速從存儲(chǔ)系統(tǒng)中提取所需信息來支持對話。每當(dāng)用戶發(fā)起互動(dòng)時(shí),Talker組件就會(huì)被觸發(fā),并通過訪問存儲(chǔ)系統(tǒng)來指導(dǎo)其回應(yīng)過程。
 - 深度思考型的Reasoner組件(第二系統(tǒng)):它專注于執(zhí)行需要深入思考的多步推理和規(guī)劃任務(wù)。該組件不僅負(fù)責(zé)調(diào)用各種工具和執(zhí)行具體操作,還要更新系統(tǒng)狀態(tài)。同時(shí),它也承擔(dān)著構(gòu)建和更新用戶信念狀態(tài)的任務(wù),這些信息會(huì)以結(jié)構(gòu)化的語言形式保存在存儲(chǔ)系統(tǒng)中。
 
論文在睡眠輔導(dǎo)的現(xiàn)實(shí)世界場景中實(shí)例化并驗(yàn)證了Talker-Reasoner雙代理架構(gòu)。這個(gè)案例研究允許定性測試Reasoner的規(guī)劃和推理能力以及Talker的互動(dòng)性。
睡眠輔導(dǎo)智能系統(tǒng)案例分析
睡眠輔導(dǎo)智能系統(tǒng)的構(gòu)建:
- Talker智能體:利用專家提供的指導(dǎo)原則,編碼睡眠領(lǐng)域的專業(yè)知識(shí)。這些原則描述了智能體的特性(如表現(xiàn)同理心、進(jìn)行對話交流、提供準(zhǔn)確建議)和睡眠輔導(dǎo)的各個(gè)階段(包括理解、目標(biāo)設(shè)定和輔導(dǎo)計(jì)劃)。Talker智能體基于強(qiáng)大的語言模型實(shí)現(xiàn),能夠理解復(fù)雜模式并生成深思熟慮的對話回應(yīng)。
 - Reasoner智能體:專門對用戶信念進(jìn)行建模。研究者與臨床專家合作,設(shè)計(jì)了一個(gè)JSON/XML格式的信念模式,涵蓋睡眠問題、目標(biāo)、習(xí)慣、障礙和睡眠環(huán)境等方面。在執(zhí)行多步推理/規(guī)劃時(shí),Reasoner智能體推斷并更新這些模式字段,從而創(chuàng)建或修改其信念狀態(tài)。
 - Talker和Reasoner的協(xié)作:Talker智能體是否等待Reasoner智能體完成操作,取決于當(dāng)前的信念狀態(tài)。在制定輔導(dǎo)計(jì)劃階段,Talker智能體會(huì)等待Reasoner智能體;其他情況下則不會(huì)等待。
 
定性分析結(jié)果:
- 對話示例:Talker和Reasoner智能體之間的互動(dòng)過程,包括如何根據(jù)用戶需求生成回應(yīng)和制定計(jì)劃,以及如何根據(jù)用戶反饋調(diào)整方案。
 - 基于反饋的計(jì)劃調(diào)整:Reasoner智能體如何根據(jù)Talker智能體從用戶處收集的反饋來優(yōu)化其計(jì)劃。
 
以下是一段示例對話,展示了Reasoner和Talker之間的互動(dòng):
用戶:嘿,我需要你的幫助來規(guī)劃如何營造一個(gè)放松的睡前環(huán)境。(記憶中的信念更新為:{updated-context: starting context, updated-title: Sleep Coaching, coachingphase: UNDERSTANDING})
Talker:太好了,我們開始為你打造一個(gè)放松的睡前環(huán)境吧:-) 你的臥室里有沒有什么可能會(huì)干擾你睡眠的東西?
用戶:我覺得噪音和光線太分散注意力了。你能幫我制定一個(gè)消除這些干擾的計(jì)劃嗎?(記憶中的信念保持不變)
Talker:當(dāng)然可以!這里有一個(gè)消除臥室干擾的計(jì)劃:噪音:確定噪音源,隔絕外界噪音,使用遮光窗簾來阻擋光線和減少噪音;考慮使用降噪窗簾或隔音板;試試耳塞或白噪音機(jī)。光線:...記住,一致性是關(guān)鍵。每晚都堅(jiān)持這個(gè)計(jì)劃,以營造一個(gè)平靜而黑暗的睡眠環(huán)境。還有什么我可以幫助你的嗎?
用戶:當(dāng)然,這很有用。不過,我希望步驟能更詳細(xì)一些。還想看看如何在我的臥室里營造一個(gè)寧靜放松的氛圍的資源。(記憶中的信念更新為:{user context: UserCollectedContextData(primary-sleep-concern: Noise and light distractions in the bedroom), coaching phase: CoachingPhase(value=PLANNING)})
Reasoner的計(jì)劃:當(dāng)然!讓我們更深入地看看你的計(jì)劃的第一步:步驟:選擇一個(gè)平靜的色彩調(diào)色板。描述:在選擇臥室顏色時(shí),選擇柔和的中性色調(diào),如柔和的藍(lán)色、綠色或灰色。這些色調(diào)已被科學(xué)證明可以促進(jìn)放松和寧靜。1. YouTube視頻:(鏈接)標(biāo)題:創(chuàng)造放松和無壓力臥室的墻面顏色創(chuàng)意。頻道:roomdsignTV。推理:這個(gè)來自roomdsignTV的視頻提供了平靜臥室色彩調(diào)色板的視覺示例。它展示了舒緩色彩對營造寧靜氛圍的影響。2. YouTube播放列表:(鏈接)標(biāo)題:Berger油漆色彩組合。頻道:Hresun Interiors。推理:這個(gè)來自Hresun Interiors的播放列表提供了一系列的臥室色彩組合創(chuàng)意。它涵蓋了從傳統(tǒng)到現(xiàn)代的多種風(fēng)格,幫助你找到適合臥室的完美色彩方案。
Talker:復(fù)制Reasoner的回應(yīng)如果對內(nèi)容有什么疑問和建議可以私信和留言,也可以添加我加入大模型交流群,一起討論大模型在創(chuàng)作、RAG和agent中的應(yīng)用。















 
 
 











 
 
 
 