AI Agents和Agentic AI: 智能體概念分類(lèi)、應(yīng)用與挑戰(zhàn) - 康奈爾大學(xué)等
摘要
本綜述批判性地區(qū)分了人工智能代理和代理性人工智能,提供了一個(gè)結(jié)構(gòu)化的概念分類(lèi)、應(yīng)用映射,并分析了機(jī)會(huì)與挑戰(zhàn),以闡明它們不同的設(shè)計(jì)理念和能力。我們首先概述了搜索策略和基本定義,將人工智能代理描述為由大型語(yǔ)言模型和大型知識(shí)圖譜驅(qū)動(dòng)和啟用的模塊化系統(tǒng),用于特定任務(wù)的自動(dòng)化。生成式人工智能被定位為提供基礎(chǔ)的前驅(qū),人工智能代理則通過(guò)工具集成、提示工程和推理增強(qiáng)而發(fā)展。然后我們描述了代理性人工智能系統(tǒng),與人工智能代理相比,它代表了一種由多代理協(xié)作、動(dòng)態(tài)任務(wù)分解、持久記憶和協(xié)調(diào)自主性所標(biāo)志的范式轉(zhuǎn)變。通過(guò)對(duì)架構(gòu)演變、操作機(jī)制、交互風(fēng)格和自主水平的時(shí)間順序評(píng)估,我們進(jìn)行了人工智能代理和代理性人工智能范式的比較分析。由人工智能代理(如客戶(hù)支持、調(diào)度和數(shù)據(jù)總結(jié))啟用的應(yīng)用程序主動(dòng)性與研究自動(dòng)化、機(jī)器人協(xié)調(diào)和醫(yī)療決策支持中的代理人工智能部署進(jìn)行了對(duì)比。我們進(jìn)一步探討了每個(gè)范式中的獨(dú)特挑戰(zhàn),包括幻覺(jué)、脆弱性、涌現(xiàn)行為和協(xié)調(diào)失敗,并提出了針對(duì)性的解決方案,如反應(yīng)循環(huán)、檢索增強(qiáng)生成(RAG)、自動(dòng)化協(xié)調(diào)層和因果建模。本工作的目標(biāo)是為開(kāi)發(fā)健壯、可擴(kuò)展且可解釋的人工智能驅(qū)動(dòng)系統(tǒng)提供路線(xiàn)圖。
關(guān)鍵詞 - Agent、智能體、人工智能代理、代理人工智能、自主性、推理、上下文感知、多代理系統(tǒng)、概念分類(lèi)法、視覺(jué)語(yǔ)言模型
核心速覽
研究背景
- 研究問(wèn)題:這篇文章旨在區(qū)分AI代理和代理AI,提供一種結(jié)構(gòu)化的概念分類(lèi)、應(yīng)用映射以及分析機(jī)會(huì)和挑戰(zhàn),以闡明它們不同的設(shè)計(jì)理念和能力。
- 研究難點(diǎn):該問(wèn)題的研究難點(diǎn)包括:如何明確AI代理和代理AI的設(shè)計(jì)哲學(xué)和能力差異;如何在復(fù)雜動(dòng)態(tài)環(huán)境中實(shí)現(xiàn)多代理系統(tǒng)的協(xié)調(diào)和自主性;如何應(yīng)對(duì)AI代理和代理AI的獨(dú)特挑戰(zhàn),如幻覺(jué)、脆弱性、涌現(xiàn)行為和協(xié)調(diào)失敗。
- 相關(guān)工作:早期的人工智能研究主要集中在多代理系統(tǒng)和專(zhuān)家系統(tǒng)上,強(qiáng)調(diào)社會(huì)行動(dòng)和分布式智能。Castelfranchi和Ferber等人的工作奠定了社會(huì)行動(dòng)建模的基礎(chǔ),而早期的對(duì)話(huà)系統(tǒng)和反應(yīng)式機(jī)器人則展示了基本的社交互動(dòng)能力。然而,這些系統(tǒng)缺乏自我學(xué)習(xí)、生成推理和對(duì)非結(jié)構(gòu)化環(huán)境的適應(yīng)性。
研究方法
這篇論文提出了一種結(jié)構(gòu)化的多階段方法來(lái)捕捉AI代理和代理AI的演變、架構(gòu)、應(yīng)用和局限性。具體來(lái)說(shuō),
- 基礎(chǔ)理解:首先,建立AI代理的基礎(chǔ)理解,分析其核心定義、設(shè)計(jì)原則和架構(gòu)模塊,包括感知、推理和行動(dòng)選擇。這些組件形成了一個(gè)閉環(huán)操作循環(huán),通常稱(chēng)為“理解、思考、行動(dòng)、學(xué)習(xí)”。
- 基礎(chǔ)模型的作用:討論LLMs作為核心推理組件的作用,強(qiáng)調(diào)預(yù)訓(xùn)練語(yǔ)言模型如何通過(guò)指令微調(diào)和強(qiáng)化學(xué)習(xí)從人類(lèi)反饋中改進(jìn)交互、規(guī)劃、決策和有限的任務(wù)執(zhí)行能力。LLMs如GPT-4和PaLM在自然語(yǔ)言理解、問(wèn)答、摘要、對(duì)話(huà)連貫性和符號(hào)推理方面表現(xiàn)出強(qiáng)大的能力。
- 代理AI的演變:探討從工具增強(qiáng)的單代理系統(tǒng)到協(xié)作、數(shù)據(jù)分布式生態(tài)系統(tǒng)的轉(zhuǎn)變,這種轉(zhuǎn)變是由系統(tǒng)需要分解目標(biāo)、分配子任務(wù)、協(xié)調(diào)輸出和適應(yīng)動(dòng)態(tài)上下文的需求驅(qū)動(dòng)的。代理AI系統(tǒng)由多個(gè)專(zhuān)門(mén)代理組成,每個(gè)代理分配一個(gè)特定的子任務(wù),并通過(guò)集中式協(xié)調(diào)器或去中心化協(xié)議進(jìn)行協(xié)調(diào)。
結(jié)果與分析
- AI代理的應(yīng)用:AI代理在客戶(hù)支持自動(dòng)化、內(nèi)部企業(yè)搜索、電子郵件過(guò)濾和優(yōu)先級(jí)排序、個(gè)性化內(nèi)容推薦和基本數(shù)據(jù)報(bào)告等領(lǐng)域得到了廣泛應(yīng)用。例如,AI代理可以集成企業(yè)的客戶(hù)關(guān)系管理系統(tǒng)(CRM)和履行API,回答用戶(hù)查詢(xún)、跟蹤訂單或發(fā)起退貨請(qǐng)求。
- 代理AI的應(yīng)用:代理AI在多代理研究助理、智能機(jī)器人協(xié)調(diào)、協(xié)作醫(yī)療決策支持和自適應(yīng)工作流程自動(dòng)化等領(lǐng)域得到了廣泛應(yīng)用。例如,在多代理研究助理中,代理系統(tǒng)可以分配角色,管理依賴(lài)關(guān)系,并將輸出整合成連貫的草稿或?qū)彶檎?img src="https://s2.51cto.com/oss/202506/08/f139fee112f1e305bca072ada5d4139c065dd4.png" alt='AI Agents和Agentic AI: 智能體概念分類(lèi)、應(yīng)用與挑戰(zhàn) - 康奈爾大學(xué)等-AI.x社區(qū)' title='AI Agents和Agentic AI: 智能體概念分類(lèi)、應(yīng)用與挑戰(zhàn) - 康奈爾大學(xué)等-AI.x社區(qū)' style="width: 638px; visibility: visible;" data-type="inline">
- 挑戰(zhàn)與限制:AI代理面臨的主要挑戰(zhàn)包括缺乏因果推理、LLM的繼承限制(如幻覺(jué)、淺層推理)、不完全的代理屬性(如自主性、主動(dòng)性)以及長(zhǎng)期規(guī)劃和恢復(fù)的失敗。代理AI系統(tǒng)面臨的獨(dú)特挑戰(zhàn)包括放大因果關(guān)系問(wèn)題、協(xié)調(diào)瓶頸、涌現(xiàn)行為和可擴(kuò)展性問(wèn)題。
總體結(jié)論
這篇論文全面評(píng)估了AI代理和代理AI系統(tǒng)的演變景觀(guān),提供了一個(gè)結(jié)構(gòu)化的分類(lèi)法,突出了基礎(chǔ)概念、架構(gòu)演變、應(yīng)用領(lǐng)域以及關(guān)鍵限制和潛在解決方案。AI代理在狹義的工具集成場(chǎng)景中表現(xiàn)良好,而代理AI代表了向分布式、多代理認(rèn)知的轉(zhuǎn)變,能夠自主規(guī)劃和決策。從反應(yīng)性任務(wù)執(zhí)行到協(xié)調(diào)的協(xié)作工作流程的轉(zhuǎn)變標(biāo)志著智能系統(tǒng)進(jìn)化的重要里程碑。這些見(jiàn)解為未來(lái)開(kāi)發(fā)和部署可信賴(lài)、可擴(kuò)展的代理AI系統(tǒng)提供了路線(xiàn)圖。
論文評(píng)價(jià)
優(yōu)點(diǎn)與創(chuàng)新
- 全面的概念分類(lèi):論文提供了一種結(jié)構(gòu)化的概念分類(lèi)法,清晰地界定了AI代理和代理AI之間的差異,幫助研究人員更好地理解這兩種技術(shù)的核心概念。
- 詳細(xì)的架構(gòu)演化分析:通過(guò)對(duì)比分析AI代理和代理AI的架構(gòu)演化,展示了從單一模型到復(fù)雜多代理系統(tǒng)的轉(zhuǎn)變過(guò)程。
- 豐富的應(yīng)用領(lǐng)域覆蓋:論文詳細(xì)探討了AI代理和代理AI在不同應(yīng)用領(lǐng)域的部署情況,包括客戶(hù)服務(wù)自動(dòng)化、內(nèi)部企業(yè)搜索、電子郵件過(guò)濾和優(yōu)先級(jí)排序等。
- 深入的挑戰(zhàn)與解決方案:論文系統(tǒng)地分析了AI代理和代理AI面臨的主要挑戰(zhàn),并提出了相應(yīng)的解決方案,如檢索增強(qiáng)生成(RAG)、工具增強(qiáng)推理、記憶架構(gòu)等。
- 未來(lái)的路線(xiàn)圖:論文提出了一個(gè)未來(lái)發(fā)展的路線(xiàn)圖,預(yù)測(cè)了AI代理和代理AI在自主性、模塊化智能、多代理協(xié)調(diào)等方面的進(jìn)步。
不足與反思
- 局限性:論文提到,盡管AI代理在某些特定任務(wù)中表現(xiàn)出色,但在處理復(fù)雜、動(dòng)態(tài)、多步驟和協(xié)作場(chǎng)景時(shí)仍存在局限性。
- 代理AI的挑戰(zhàn):代理AI系統(tǒng)面臨的挑戰(zhàn)包括放大因果問(wèn)題、協(xié)調(diào)瓶頸、涌現(xiàn)行為和治理問(wèn)題,這些都需要進(jìn)一步的研究來(lái)解決。
- 未來(lái)的研究方向:論文指出,未來(lái)的研究需要解決多代理系統(tǒng)中的因果發(fā)現(xiàn)、推理集成和基準(zhǔn)測(cè)試等問(wèn)題,以確保代理AI系統(tǒng)的可靠性和可擴(kuò)展性。
關(guān)鍵問(wèn)題及回答
問(wèn)題1:AI代理和代理AI在設(shè)計(jì)哲學(xué)和能力上有何根本區(qū)別?
- 任務(wù)范圍:AI代理通常是單體的,專(zhuān)注于執(zhí)行特定的、定義明確的任務(wù)。它們通過(guò)集成LLM和 LIMs來(lái)增強(qiáng)功能,適用于工具集成場(chǎng)景。而代理AI則是多體的,能夠分解復(fù)雜的目標(biāo),分配子任務(wù),并通過(guò)協(xié)作實(shí)現(xiàn)共同目標(biāo)。
- 自主性和協(xié)作:AI代理在特定任務(wù)內(nèi)具有高度自主性,但通常獨(dú)立操作,缺乏跨任務(wù)的協(xié)作能力。代理AI則具有廣泛的自主性,能夠在多代理系統(tǒng)中進(jìn)行動(dòng)態(tài)的角色分配和任務(wù)協(xié)調(diào)。
- 學(xué)習(xí)和適應(yīng)能力:AI代理主要通過(guò)規(guī)則或監(jiān)督學(xué)習(xí)進(jìn)行適應(yīng),通常局限于單一領(lǐng)域。代理AI則具備更強(qiáng)的學(xué)習(xí)和適應(yīng)能力,能夠通過(guò)多步驟規(guī)劃和元學(xué)習(xí)在不同的任務(wù)和環(huán)境中進(jìn)行動(dòng)態(tài)調(diào)整。
- 應(yīng)用場(chǎng)景:AI代理適用于客戶(hù)支持、內(nèi)部搜索、電子郵件管理等結(jié)構(gòu)化任務(wù)。代理AI則更適合于復(fù)雜的研究助理、機(jī)器人協(xié)調(diào)、醫(yī)療決策支持等需要多代理協(xié)作的場(chǎng)景。
問(wèn)題2:代理AI系統(tǒng)在應(yīng)對(duì)復(fù)雜動(dòng)態(tài)環(huán)境中的多代理協(xié)作時(shí)面臨哪些獨(dú)特挑戰(zhàn)?
- 放大因果關(guān)系問(wèn)題:在多代理系統(tǒng)中,一個(gè)代理的行為可能會(huì)影響其他代理的行為,導(dǎo)致復(fù)雜的因果關(guān)系。代理AI需要有效的因果建模和干預(yù)機(jī)制來(lái)協(xié)調(diào)這些關(guān)系。
- 協(xié)調(diào)瓶頸:多代理系統(tǒng)需要高效的通信和協(xié)調(diào)機(jī)制來(lái)確保所有代理能夠協(xié)同工作。當(dāng)前的實(shí)現(xiàn)中存在目標(biāo)對(duì)齊和共享上下文的問(wèn)題,影響了系統(tǒng)的整體性能。
- 涌現(xiàn)行為:多代理系統(tǒng)中的復(fù)雜交互可能導(dǎo)致不可預(yù)測(cè)的涌現(xiàn)行為,這些行為可能偏離預(yù)期目標(biāo),甚至產(chǎn)生有害結(jié)果。代理AI需要設(shè)計(jì)機(jī)制來(lái)檢測(cè)和應(yīng)對(duì)這些行為。
- 可擴(kuò)展性和調(diào)試復(fù)雜性:隨著代理數(shù)量的增加,系統(tǒng)的可擴(kuò)展性和調(diào)試復(fù)雜性也隨之增加。代理AI需要系統(tǒng)化的架構(gòu)控制和可追溯工具來(lái)支持大規(guī)模系統(tǒng)的開(kāi)發(fā)和維護(hù)。
問(wèn)題3:論文中提到的潛在解決方案有哪些?這些方案如何克服AI代理和代理AI的挑戰(zhàn)?
- 檢索增強(qiáng)生成(RAG):通過(guò)將用戶(hù)查詢(xún)與實(shí)時(shí)數(shù)據(jù)結(jié)合,生成更準(zhǔn)確和上下文相關(guān)的響應(yīng)。這種方法適用于AI代理和代理AI,特別是在需要實(shí)時(shí)數(shù)據(jù)集成的場(chǎng)景中。
- 工具增強(qiáng)推理:使AI代理能夠通過(guò)調(diào)用外部工具來(lái)擴(kuò)展其功能,從而處理更復(fù)雜的任務(wù)。這種方法顯著提高了AI代理的實(shí)用性和代理AI的自主性。
- 代理反饋循環(huán)(ReAct):通過(guò)迭代推理和行動(dòng)來(lái)提高決策的質(zhì)量。這種方法特別適用于需要多步驟規(guī)劃和動(dòng)態(tài)調(diào)整的場(chǎng)景,適用于AI代理和代理AI。
- 記憶架構(gòu):通過(guò)持久存儲(chǔ)來(lái)保持跨任務(wù)的上下文信息,支持長(zhǎng)期規(guī)劃和任務(wù)執(zhí)行。這種方法有助于解決AI代理的短期記憶問(wèn)題和代理AI的分布式記憶管理問(wèn)題。
- 多代理編排:通過(guò)集中式或分布式的協(xié)調(diào)器來(lái)管理多代理系統(tǒng)的生命周期和任務(wù)分配。這種方法有助于解決代理AI的系統(tǒng)化和可擴(kuò)展性問(wèn)題。
這些解決方案共同構(gòu)成了克服AI代理和代理AI挑戰(zhàn)的綜合路線(xiàn)圖,旨在提高系統(tǒng)的可靠性、可擴(kuò)展性和適應(yīng)性。
本文轉(zhuǎn)載自???知識(shí)圖譜科技???,作者:知識(shí)圖譜科技
