偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專(zhuān)業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率

發(fā)布于 2024-7-31 00:46

瀏覽

0收藏

多智能體系統(tǒng)（MAS）是一種通過(guò)多個(gè)智能體的協(xié)作來(lái)解決復(fù)雜問(wèn)題的技術(shù)。這些智能體可以是軟件代理、機(jī)器人或其他自主系統(tǒng)，能夠在動(dòng)態(tài)環(huán)境中進(jìn)行交互和決策。MAS在許多領(lǐng)域有廣泛的應(yīng)用，包括交通管理、金融市場(chǎng)模擬、災(zāi)害應(yīng)急響應(yīng)、社會(huì)行為研究等。隨著應(yīng)用規(guī)模的擴(kuò)大，現(xiàn)有的多智能體系統(tǒng)面臨擴(kuò)展性和效率問(wèn)題、智能體多樣性不足、管理過(guò)程復(fù)雜的問(wèn)題。

近日由來(lái)自阿里巴巴集團(tuán)和中國(guó)人民大學(xué)組成的聯(lián)合研究團(tuán)隊(duì)推出AgentScope平臺(tái)，對(duì)超大規(guī)模多智能體模擬中的最新改進(jìn)取得非常的技術(shù)成果。AgentScope是一個(gè)用戶(hù)友好的多智能體平臺(tái)，旨在解決現(xiàn)有平臺(tái)在擴(kuò)展性、效率、智能體多樣性和管理過(guò)程方面的挑戰(zhàn)。通過(guò)引入基于actor模型的分布式機(jī)制、靈活的環(huán)境支持、易用的配置工具和自動(dòng)背景生成管道，AgentScope顯著提升了大規(guī)模多智能體模擬的便利性和靈活性。

同時(shí)，研究團(tuán)隊(duì)發(fā)表的論文《Very Large-Scale Multi-Agent Simulation in AgentScope》探討了大規(guī)模多智能體模擬在不同領(lǐng)域的潛力，通過(guò)一系列綜合模擬實(shí)驗(yàn)，展示AgentScope在支持大規(guī)模多智能體模擬方面的有效性，并提供詳細(xì)的觀察和討論，強(qiáng)調(diào)多智能體系統(tǒng)在大規(guī)模模擬中的巨大潛力。

研究團(tuán)隊(duì)里阿里巴巴集團(tuán)的人員有Xuchen Pan、Dawei Gao、Yuexiang Xie、Yaliang Li、Bolin Ding、Jingren Zhou，這些研究人員在阿里巴巴集團(tuán)工作，專(zhuān)注于大規(guī)模多智能體系統(tǒng)和相關(guān)技術(shù)的研究與開(kāi)發(fā)。中國(guó)人民大學(xué)的人員有Zhewei Wei、Ji-Rong Wen，這兩位研究人員來(lái)自中國(guó)人民大學(xué)，致力于多智能體系統(tǒng)和人工智能領(lǐng)域的研究。

論文的源代碼已在GitHub上發(fā)布（鏈接地址https://github.com/modelscope/agentscope），該項(xiàng)目在GitHub上有3.9k顆星和249個(gè)分支。這一開(kāi)源項(xiàng)目為研究人員和開(kāi)發(fā)者提供了一個(gè)強(qiáng)大的工具，支持他們?cè)诖笠?guī)模多智能體模擬領(lǐng)域進(jìn)行創(chuàng)新和探索。

多智能體系統(tǒng)的現(xiàn)狀與挑戰(zhàn)

多智能體系統(tǒng)（MAS）在許多領(lǐng)域中都有廣泛的應(yīng)用，如交通管理、金融市場(chǎng)模擬、災(zāi)害應(yīng)急響應(yīng)和社會(huì)行為研究等。然而，現(xiàn)有的多智能體模擬平臺(tái)在擴(kuò)展性、效率、智能體多樣性和管理過(guò)程等方面仍存在諸多局限性。

隨著智能體數(shù)量的增加，現(xiàn)有平臺(tái)在組織智能體執(zhí)行任務(wù)和通信方面的效率顯著下降。在大規(guī)模模擬中，智能體需要按照一定的順序執(zhí)行任務(wù)，并進(jìn)行頻繁的通信和協(xié)作。然而，現(xiàn)有平臺(tái)在處理大量智能體時(shí)，往往難以高效地組織這些任務(wù)，導(dǎo)致模擬時(shí)間過(guò)長(zhǎng)，結(jié)果不準(zhǔn)確。大規(guī)模模擬需要大量的計(jì)算資源，現(xiàn)有平臺(tái)在資源分配和利用方面存在不足，無(wú)法充分利用多核處理器和分布式計(jì)算資源，導(dǎo)致計(jì)算效率低下。智能體之間的通信是多智能體系統(tǒng)的重要組成部分，但在大規(guī)模模擬中，通信開(kāi)銷(xiāo)往往成為瓶頸，限制了系統(tǒng)的擴(kuò)展性和效率。

大規(guī)模模擬需要智能體表現(xiàn)出多樣化的行為，以便更真實(shí)地再現(xiàn)復(fù)雜系統(tǒng)的行為。然而現(xiàn)有平臺(tái)在智能體背景設(shè)置和行為多樣性方面的支持有限，現(xiàn)有平臺(tái)通常只提供簡(jiǎn)單的背景設(shè)置，難以生成具有豐富背景和多樣化行為的智能體。這使得模擬結(jié)果缺乏現(xiàn)實(shí)性和代表性。由于背景設(shè)置的單一性，智能體的行為模式往往趨于同質(zhì)化，難以模擬真實(shí)世界中的復(fù)雜場(chǎng)景和多樣化行為?，F(xiàn)有平臺(tái)在智能體間的互動(dòng)設(shè)計(jì)上存在不足，難以支持復(fù)雜的互動(dòng)行為和動(dòng)態(tài)變化，限制了模擬的深度和廣度。

管理大量分布在多個(gè)設(shè)備上的智能體，包括初始化、執(zhí)行和終止智能體，以及監(jiān)控其狀態(tài)和交互，過(guò)程繁瑣且耗時(shí)。在大規(guī)模模擬中，初始化和配置大量智能體需要耗費(fèi)大量時(shí)間和精力，現(xiàn)有平臺(tái)缺乏高效的配置工具和自動(dòng)化支持。在模擬執(zhí)行過(guò)程中，監(jiān)控智能體的狀態(tài)和行為是一個(gè)復(fù)雜的任務(wù)，現(xiàn)有平臺(tái)在監(jiān)控工具和界面設(shè)計(jì)上存在不足，難以提供全面和實(shí)時(shí)的監(jiān)控。在模擬結(jié)束后，終止和清理大量智能體同樣是一個(gè)耗時(shí)的過(guò)程，現(xiàn)有平臺(tái)缺乏高效的終止和清理機(jī)制。

為了提升多智能體模擬的現(xiàn)實(shí)性和可靠性，減少人力干預(yù)，論文提出了對(duì)AgentScope平臺(tái)的多項(xiàng)改進(jìn)，旨在解決上述挑戰(zhàn)，支持超大規(guī)模多智能體模擬。

通過(guò)引入基于actor模型的分布式機(jī)制、靈活的環(huán)境支持、易用的配置工具和自動(dòng)背景生成管道，AgentScope顯著提升了大規(guī)模多智能體模擬的現(xiàn)實(shí)性和可靠性。基于actor模型的分布式架構(gòu)支持自動(dòng)并行執(zhí)行和集中工作流編排，顯著提升了模擬的擴(kuò)展性和效率。多層環(huán)境結(jié)構(gòu)和高頻訪問(wèn)支持能夠靈活模擬各種現(xiàn)實(shí)場(chǎng)景，增強(qiáng)了模擬的現(xiàn)實(shí)性。配置工具和自動(dòng)背景生成管道簡(jiǎn)化了創(chuàng)建多樣化智能體的過(guò)程，提升了智能體的多樣性和行為的現(xiàn)實(shí)性。

通過(guò)提供易用的配置工具和自動(dòng)化支持，AgentScope顯著減少了大規(guī)模多智能體模擬中的人力干預(yù)。用戶(hù)可以定義模擬的總?cè)丝?，并從多個(gè)角度指定人口分布，提供常用的分布模板，支持?jǐn)U展新的方面，簡(jiǎn)化了智能體的初始化和配置過(guò)程。根據(jù)配置工具提供的分布，自動(dòng)生成詳細(xì)且多樣化的背景設(shè)置，引入更多多樣性，減少了手動(dòng)設(shè)置的工作量?；赪eb的界面提供了全面和實(shí)時(shí)的監(jiān)控，簡(jiǎn)化了智能體的執(zhí)行和監(jiān)控過(guò)程，提高了管理效率。

AgentScope平臺(tái)的改進(jìn)

AgentScope平臺(tái)在大規(guī)模多智能體模擬中引入了多項(xiàng)關(guān)鍵改進(jìn)，旨在解決現(xiàn)有平臺(tái)在擴(kuò)展性、效率、智能體多樣性和管理過(guò)程方面的挑戰(zhàn)。

分布式機(jī)制

AgentScope采用了基于actor模型的分布式架構(gòu)，這種架構(gòu)在并行計(jì)算和分布式系統(tǒng)中具有顯著優(yōu)勢(shì)。actor模型是一種并發(fā)計(jì)算的數(shù)學(xué)模型，其中每個(gè)actor作為基本計(jì)算單元，獨(dú)立接收消息并進(jìn)行計(jì)算。通過(guò)這種方式，AgentScope能夠?qū)崿F(xiàn)高效的任務(wù)分配和執(zhí)行。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖1：自動(dòng)并行執(zhí)行的一個(gè)示例，其中圓圈表示代理，有向邊表示消息傳遞流。

在AgentScope中，每個(gè)智能體被視為一個(gè)獨(dú)立的actor，能夠并行執(zhí)行任務(wù)并與其他智能體進(jìn)行通信。這種設(shè)計(jì)不僅提高了系統(tǒng)的擴(kuò)展性，還減少了任務(wù)執(zhí)行的時(shí)間。具體來(lái)說(shuō)，AgentScope通過(guò)通信圖動(dòng)態(tài)識(shí)別可執(zhí)行的智能體，這些智能體可以自動(dòng)并行執(zhí)行，利用最大可用資源。

為了進(jìn)一步提升效率，AgentScope引入了自動(dòng)并行執(zhí)行和集中工作流編排機(jī)制。自動(dòng)并行執(zhí)行通過(guò)格式化智能體間的交互為通信圖，實(shí)現(xiàn)了智能體的并行執(zhí)行。每個(gè)智能體在接收到所需的消息后才會(huì)觸發(fā)內(nèi)部計(jì)算，這樣可以確保智能體僅依賴(lài)于必要的消息，從而實(shí)現(xiàn)高效的并行執(zhí)行。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖2：占位符如何在模擬中發(fā)揮作用，以使用戶(hù)能夠集中協(xié)調(diào)工作流程。

集中工作流編排則通過(guò)代理機(jī)制在中心進(jìn)程中管理分布式智能體的通信。代理機(jī)制隱藏了遠(yuǎn)程計(jì)算的復(fù)雜性，使用戶(hù)能夠在中心進(jìn)程中指定分布式智能體之間的通信。為了確保工作流執(zhí)行不被分布式智能體的計(jì)算阻塞，AgentScope引入了占位符概念。當(dāng)代理接收到消息時(shí)，會(huì)立即返回占位符，并將消息轉(zhuǎn)發(fā)給對(duì)應(yīng)的分布式智能體。智能體在接收到所有實(shí)際值后才會(huì)執(zhí)行內(nèi)部計(jì)算，從而實(shí)現(xiàn)了獨(dú)立分布式智能體的并行運(yùn)行。

這種設(shè)計(jì)不僅提高了智能體間通信的效率，還簡(jiǎn)化了用戶(hù)的操作，使得大規(guī)模多智能體模擬變得更加便捷和高效。

靈活的環(huán)境支持

AgentScope提供了多層環(huán)境結(jié)構(gòu)，支持組內(nèi)信息同步和組間信息差異化，增強(qiáng)了模擬的靈活性。在多智能體模擬中，環(huán)境是智能體交互的重要組成部分。AgentScope通過(guò)抽象環(huán)境操作為注冊(cè)、查詢(xún)、更新、刪除和監(jiān)控等基本操作，支持高頻訪問(wèn)和數(shù)據(jù)同步。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖3：基于代理的模擬的多層環(huán)境結(jié)構(gòu)。

多層環(huán)境結(jié)構(gòu)允許為不同的智能體組建立獨(dú)立的環(huán)境，以提供交互項(xiàng)和共享信息。在這些環(huán)境之上，還可以設(shè)置一個(gè)全局環(huán)境進(jìn)行全局同步。這種設(shè)計(jì)特別適用于需要組內(nèi)協(xié)作和組間信息差異化的模擬場(chǎng)景，例如社會(huì)行為模擬和團(tuán)隊(duì)合作模擬。

為了滿(mǎn)足大規(guī)模模擬中高頻訪問(wèn)的需求，AgentScope實(shí)現(xiàn)了分布式節(jié)點(diǎn)的環(huán)境模塊，通過(guò)遠(yuǎn)程過(guò)程調(diào)用（RPC）與智能體進(jìn)行通信。環(huán)境模塊在接收到智能體的請(qǐng)求后，會(huì)根據(jù)訪問(wèn)的數(shù)據(jù)將請(qǐng)求分類(lèi)到不同的隊(duì)列中，并同時(shí)處理這些隊(duì)列中的請(qǐng)求，以解決數(shù)據(jù)沖突問(wèn)題。

用戶(hù)可以根據(jù)可用的硬件資源設(shè)置最大并發(fā)數(shù)，從而優(yōu)化環(huán)境模塊的性能。此外，AgentScope還提供了時(shí)間線和位置兩個(gè)維度的交互，支持智能體根據(jù)全局時(shí)間調(diào)整行為，并在地圖上與附近的智能體或物品進(jìn)行交互。這種設(shè)計(jì)提供了靈活的環(huán)境支持，能夠模擬各種現(xiàn)實(shí)場(chǎng)景，增強(qiáng)了模擬的現(xiàn)實(shí)性和多樣性。

易用的配置工具與自動(dòng)背景生成

AgentScope集成了易用的配置工具，用戶(hù)可以定義模擬的總?cè)丝?，并從多個(gè)角度指定人口分布。配置工具提供了一些常用的分布模板，例如年齡、性別、職業(yè)、國(guó)籍和教育水平等，用戶(hù)也可以根據(jù)需要擴(kuò)展新的方面。

通過(guò)配置工具，用戶(hù)只需簡(jiǎn)單地指定人口分布，即可生成大量具有詳細(xì)且多樣化特征的智能體。這些智能體可以通過(guò)AgentScope-Manager模塊方便地管理和監(jiān)控，該模塊簡(jiǎn)化了大規(guī)模智能體模擬的組織和觀察過(guò)程。

在配置工具提供的分布基礎(chǔ)上，AgentScope還提供了自動(dòng)背景生成管道，用于生成詳細(xì)且多樣化的背景設(shè)置。當(dāng)用戶(hù)啟動(dòng)模擬時(shí)，系統(tǒng)會(huì)根據(jù)配置工具提供的分布，從中抽取具體值，并將其轉(zhuǎn)換為JSON格式，填充到元提示中，生成完整的背景設(shè)置指令。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖4：基于網(wǎng)頁(yè)的可視化界面，適用于大規(guī)模代理商管理。

這些指令由大語(yǔ)言模型（LLMs）使用，以生成異構(gòu)的背景設(shè)置。為了引入更多的多樣性，生成過(guò)程會(huì)調(diào)整隨機(jī)種子和溫度。通過(guò)這種方式，AgentScope能夠自動(dòng)生成具有豐富背景和多樣化行為的智能體，減少了手動(dòng)設(shè)置的工作量，提高了模擬的現(xiàn)實(shí)性和代表性。

AgentScope通過(guò)引入基于actor模型的分布式機(jī)制、靈活的環(huán)境支持、易用的配置工具和自動(dòng)背景生成管道，顯著提升了大規(guī)模多智能體模擬的擴(kuò)展性、效率和多樣性。這些改進(jìn)不僅解決了現(xiàn)有平臺(tái)的局限性，還為研究人員和開(kāi)發(fā)者提供了一個(gè)強(qiáng)大的工具，支持他們?cè)诖笠?guī)模多智能體模擬領(lǐng)域進(jìn)行創(chuàng)新和探索。

實(shí)驗(yàn)與結(jié)果分析

研究團(tuán)隊(duì)通過(guò)一系列實(shí)驗(yàn)驗(yàn)證了AgentScope在大規(guī)模多智能體模擬中的性能和效果。以下是實(shí)驗(yàn)設(shè)置、擴(kuò)展性與效率分析以及模擬結(jié)果與分析的詳細(xì)解讀。

實(shí)驗(yàn)設(shè)置

實(shí)驗(yàn)在一個(gè)包含多個(gè)設(shè)備的集群上進(jìn)行，每個(gè)設(shè)備配備8個(gè)A100-80G GPU、64核CPU和1TB內(nèi)存。為了處理高并發(fā)的服務(wù)請(qǐng)求，研究團(tuán)隊(duì)采用了vLLM作為L(zhǎng)LM推理引擎。實(shí)驗(yàn)中使用了六種不同大小的開(kāi)源LLM，包括Llama3-8B、Llama3-70B、Qwen2-7B、Qwen2-72B、MistralAI-8×7B和MistralAI-8×22B。

在實(shí)驗(yàn)中，除非特別說(shuō)明，每個(gè)設(shè)備上部署八個(gè)Qwen2-7B或Llama3-8B模型，兩個(gè)Qwen2-72B、Llama3-70B或MistralAI-8×7B模型，或一個(gè)MistralAI-8×22B模型。所有LLM的生成溫度設(shè)置為1.0，以促進(jìn)響應(yīng)的多樣性。此外，為了防止響應(yīng)格式錯(cuò)誤，每個(gè)智能體在每輪游戲中執(zhí)行兩次LLM服務(wù)器調(diào)用。第一次調(diào)用用于生成響應(yīng)，包括其思維過(guò)程和報(bào)告的數(shù)字，第二次調(diào)用用于正確提取報(bào)告的數(shù)字。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖5：基于代理的模擬，具有不同規(guī)模的代理（a、b）和不同數(shù)量的設(shè)備（c、d）。

為了指導(dǎo)智能體在游戲中的行為，研究團(tuán)隊(duì)為智能體提供了系統(tǒng)提示。這些提示包括游戲規(guī)則、響應(yīng)格式以及行為指導(dǎo)。例如，為了鼓勵(lì)智能體逐步思考，系統(tǒng)提示中加入了“鏈?zhǔn)剿季S”研究的啟發(fā)，要求智能體在報(bào)告數(shù)字前逐步思考。

在進(jìn)一步的實(shí)驗(yàn)中，研究團(tuán)隊(duì)還在系統(tǒng)提示中加入了更詳細(xì)的行為指導(dǎo)，提醒智能體所有競(jìng)爭(zhēng)對(duì)手都是理性的，并會(huì)通過(guò)分析他人的策略來(lái)調(diào)整報(bào)告的數(shù)字。這些詳細(xì)指令旨在使智能體在報(bào)告數(shù)字前進(jìn)行更深入的思考和多樣化的考慮，從而使模擬更加實(shí)際、有意義和有趣。

擴(kuò)展性與效率

為了展示AgentScope在大規(guī)模智能體模擬中的擴(kuò)展性和效率，研究團(tuán)隊(duì)進(jìn)行了多項(xiàng)實(shí)驗(yàn)，記錄了不同規(guī)模智能體模擬的運(yùn)行時(shí)間。實(shí)驗(yàn)結(jié)果顯示，AgentScope能夠支持包含100萬(wàn)個(gè)智能體的模擬，使用4臺(tái)設(shè)備可在12分鐘內(nèi)完成。

具體來(lái)說(shuō)，當(dāng)使用Llama3-8B和基本系統(tǒng)提示（Prompt 1）時(shí)，模擬包含100萬(wàn)個(gè)智能體的運(yùn)行時(shí)間為12分鐘；而使用“鏈?zhǔn)剿季S”提示（Prompt 2）時(shí)，由于響應(yīng)的平均令牌數(shù)增加了150倍以上，運(yùn)行時(shí)間增加到85分鐘。對(duì)于最重的推理工作負(fù)載，即使用Llama3-70B和Prompt 2時(shí)，模擬運(yùn)行時(shí)間約為10.6小時(shí)。

為了更好地展示基于actor模型的分布式機(jī)制帶來(lái)的效率提升，研究團(tuán)隊(duì)采用了虛擬模型請(qǐng)求（即智能體休眠1秒并生成隨機(jī)數(shù)而不是發(fā)送請(qǐng)求）進(jìn)行模擬，以消除LLM推理速度的影響。實(shí)驗(yàn)結(jié)果顯示，使用基于actor模型的分布式機(jī)制，完成包含100萬(wàn)個(gè)智能體的模擬僅需40秒，而使用串行執(zhí)行或Python中的異步模式（現(xiàn)有工作采用的模式）則分別需要約12天和8.6小時(shí)。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖6：具有不同 LLM 和系統(tǒng)提示的代理報(bào)告的數(shù)字分布。

此外，增加設(shè)備數(shù)量可以成比例地減少模擬運(yùn)行時(shí)間。例如，當(dāng)智能體數(shù)量固定為10,000時(shí)，增加設(shè)備數(shù)量從1臺(tái)到4臺(tái)，模擬運(yùn)行時(shí)間從22分鐘減少到5.6分鐘。這表明，通過(guò)增加設(shè)備數(shù)量，AgentScope能夠顯著提升模擬的擴(kuò)展性和效率。

模擬結(jié)果與分析

實(shí)驗(yàn)結(jié)果顯示，不同系統(tǒng)提示對(duì)智能體的行為有顯著影響。使用基本系統(tǒng)提示（Prompt 1）時(shí)，大多數(shù)智能體報(bào)告的數(shù)字約為50。然而使用“鏈?zhǔn)剿季S”提示（Prompt 2）時(shí)，智能體報(bào)告的數(shù)字顯著減少，接近0。這表明詳細(xì)指令比一般指導(dǎo)（如“逐步思考”）更有效，能夠促使智能體進(jìn)行更深入的思考和更理性的決策。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖7：多輪比賽中報(bào)告數(shù)字的平均值。

在進(jìn)一步的實(shí)驗(yàn)中，研究團(tuán)隊(duì)在系統(tǒng)提示中加入了更詳細(xì)的行為指導(dǎo)（Prompt 3和Prompt 4），提醒智能體所有競(jìng)爭(zhēng)對(duì)手都是理性的，并會(huì)通過(guò)分析他人的策略來(lái)調(diào)整報(bào)告的數(shù)字。實(shí)驗(yàn)結(jié)果顯示，使用詳細(xì)指令的智能體報(bào)告的數(shù)字更接近0，表明詳細(xì)指令比一般指導(dǎo)更有效。

在多輪游戲中，智能體逐漸調(diào)整策略，報(bào)告的數(shù)字逐漸收斂到0，顯示出對(duì)游戲的良好理解和理性決策能力。例如，在多輪游戲中，智能體在每輪開(kāi)始時(shí)會(huì)被告知上一輪的獲勝數(shù)字，并根據(jù)這些信息調(diào)整策略。實(shí)驗(yàn)結(jié)果顯示，隨著游戲的進(jìn)行，智能體報(bào)告的數(shù)字逐漸接近0，表明智能體能夠有效地考慮其他智能體的行為，并做出合理的決策。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖8：不同的系統(tǒng)提示對(duì)不同的LLM的影響。

此外，使用“鏈?zhǔn)剿季S”提示的智能體比使用基本提示的智能體更快收斂到納什均衡。例如，在第五輪游戲中，使用Qwen2-72B和Prompt 2的智能體報(bào)告的平均數(shù)字為2.02，而使用Prompt 1的智能體報(bào)告的平均數(shù)字為25.16。這表明，詳細(xì)的行為指導(dǎo)能夠加速智能體達(dá)到納什均衡。

智能體多樣性研究

在多智能體系統(tǒng)的研究中，智能體的多樣性是一個(gè)關(guān)鍵因素。多樣化的智能體能夠更真實(shí)地模擬復(fù)雜系統(tǒng)中的各種行為和交互，從而提高模擬的現(xiàn)實(shí)性和代表性。研究團(tuán)隊(duì)通過(guò)對(duì)AgentScope平臺(tái)的實(shí)驗(yàn)，深入探討了智能體多樣性的重要性及其實(shí)現(xiàn)方法。

異構(gòu)配置

在AgentScope平臺(tái)中，研究團(tuán)隊(duì)通過(guò)配置工具和自動(dòng)背景生成管道，為智能體設(shè)置了多樣化的背景，包括教育水平和職業(yè)背景。具體來(lái)說(shuō)，智能體被分為多個(gè)組，每組包含200個(gè)智能體，每個(gè)組的智能體具有不同的教育水平或職業(yè)背景。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖9：具有不同教育水平的代理人報(bào)告的數(shù)字分布。

在教育水平方面，智能體被分為五個(gè)不同的教育水平：小學(xué)、高中、學(xué)士、碩士和博士。實(shí)驗(yàn)結(jié)果顯示，教育水平越高的智能體在游戲中的表現(xiàn)越理性。例如，使用Qwen2-72B的智能體中，博士教育水平的智能體報(bào)告的平均數(shù)字顯著低于小學(xué)教育水平的智能體。這表明，教育水平較高的智能體在游戲中表現(xiàn)出更強(qiáng)的推理能力和決策能力。

在職業(yè)背景方面，智能體被分為六個(gè)不同的職業(yè)：游戲理論教授、經(jīng)濟(jì)學(xué)家、心理學(xué)家、運(yùn)動(dòng)員、藝術(shù)家和作家。實(shí)驗(yàn)結(jié)果顯示，不同職業(yè)背景的智能體在游戲中的表現(xiàn)也存在顯著差異。例如，游戲理論教授和經(jīng)濟(jì)學(xué)家報(bào)告的數(shù)字較小，表現(xiàn)出更理性的行為；而藝術(shù)家和作家則可能采用更直接的策略。這些結(jié)果表明，智能體的職業(yè)背景對(duì)其行為有重要影響。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖10：不同職業(yè)的代理人報(bào)告的數(shù)字分布。

圖11：涉及具有多種 LLM 的代理的個(gè)體級(jí)別模擬。

通過(guò)對(duì)不同背景設(shè)置的智能體行為進(jìn)行分析，研究團(tuán)隊(duì)發(fā)現(xiàn)，智能體的行為與其背景設(shè)置一致。例如，具有博士教育水平的智能體在游戲中表現(xiàn)出更強(qiáng)的推理能力和決策能力，而小學(xué)教育水平的智能體則可能表現(xiàn)出較為簡(jiǎn)單的行為模式。同樣，游戲理論教授和經(jīng)濟(jì)學(xué)家在游戲中表現(xiàn)出更理性的行為，而藝術(shù)家和作家則可能采用更直接的策略。

這些結(jié)果表明，通過(guò)提供不同的背景描述，可以顯著增強(qiáng)智能體的多樣性，從而提高模擬的現(xiàn)實(shí)性和代表性。AgentScope平臺(tái)的配置工具和自動(dòng)背景生成管道為實(shí)現(xiàn)這一目標(biāo)提供了有力支持。

混合LLM的模擬實(shí)驗(yàn)

為了進(jìn)一步探討智能體多樣性，研究團(tuán)隊(duì)進(jìn)行了混合LLM的模擬實(shí)驗(yàn)。具體來(lái)說(shuō)，智能體被配置為使用不同的LLM，包括Llama3-70B、MistralAI-8×22B和Qwen2-72B，每個(gè)LLM分配500個(gè)智能體。實(shí)驗(yàn)包括個(gè)體級(jí)別和組級(jí)別的模擬。

在個(gè)體級(jí)別模擬中，每個(gè)智能體獨(dú)立參與游戲。實(shí)驗(yàn)結(jié)果顯示，不同LLM的智能體行為存在顯著差異。例如，Llama3-70B的智能體報(bào)告的數(shù)字較為一致，傾向于報(bào)告約33的數(shù)字；MistralAI-8×22B的智能體則一致報(bào)告0；Qwen2-72B的智能體表現(xiàn)出更大的行為多樣性，報(bào)告的數(shù)字范圍較廣，主要集中在0到50之間。

在組級(jí)別模擬中，智能體被分為三組，每組使用相同的LLM。每個(gè)智能體報(bào)告一個(gè)數(shù)字，組內(nèi)智能體的平均數(shù)字作為該組的報(bào)告數(shù)字。實(shí)驗(yàn)結(jié)果顯示，同組智能體的行為在第二輪后趨于一致。例如，Qwen2-72B和Llama3-70B的智能體表現(xiàn)較為一致，而MistralAI-8×22B的智能體有時(shí)會(huì)報(bào)告較大的數(shù)字。

實(shí)驗(yàn)結(jié)果表明，不同LLM的智能體在行為上存在顯著差異。例如，Llama3-70B的智能體報(bào)告的數(shù)字較為一致，而MistralAI-8×22B的智能體則一致報(bào)告0，Qwen2-72B的智能體表現(xiàn)出更大的行為多樣性。這些差異可能與LLM的架構(gòu)、訓(xùn)練語(yǔ)料等因素有關(guān)。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖12：涉及具有混合 LLM 的代理的群體級(jí)別模擬。

此外實(shí)驗(yàn)還顯示，智能體在多輪游戲中的策略調(diào)整也存在差異。例如，在多輪游戲中，智能體在每輪開(kāi)始時(shí)會(huì)被告知上一輪的獲勝數(shù)字，并根據(jù)這些信息調(diào)整策略。實(shí)驗(yàn)結(jié)果顯示，隨著游戲的進(jìn)行，智能體報(bào)告的數(shù)字逐漸接近0，表明智能體能夠有效地考慮其他智能體的行為，并做出合理的決策。

進(jìn)一步討論

在論文的最后部分，我們將進(jìn)一步探討AgentScope在大規(guī)模多智能體模擬中的一些關(guān)鍵問(wèn)題和實(shí)驗(yàn)結(jié)果。這些討論將涵蓋溫度對(duì)生成多樣性的影響、智能體扮演極端角色的表現(xiàn)、先驗(yàn)知識(shí)對(duì)智能體行為的影響以及非零納什均衡的模擬實(shí)驗(yàn)。

溫度對(duì)生成多樣性的影響

溫度是控制大語(yǔ)言模型（LLM）生成多樣性的一個(gè)重要超參數(shù)。在AgentScope的實(shí)驗(yàn)中，研究團(tuán)隊(duì)設(shè)置了1000個(gè)使用Qwen2-72B和Prompt 2的智能體，并將溫度范圍設(shè)置為{0.05, 0.25, 0.50, 1.00}。實(shí)驗(yàn)結(jié)果顯示，隨著溫度的增加，報(bào)告數(shù)字的標(biāo)準(zhǔn)差從6.50上升到8.20，而平均值變化不大。

這些結(jié)果表明，溫度對(duì)生成多樣性的影響主要體現(xiàn)在報(bào)告數(shù)字的分布上，而對(duì)總體平均值的影響較小。當(dāng)溫度較低時(shí)，智能體的行為較為一致，報(bào)告的數(shù)字集中在一個(gè)較小的范圍內(nèi)；而當(dāng)溫度較高時(shí)，智能體的行為變得更加多樣化，報(bào)告的數(shù)字分布范圍更廣。這一發(fā)現(xiàn)對(duì)于在大規(guī)模模擬中控制智能體行為的多樣性具有重要意義。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖13：游戲中設(shè)定不同比例時(shí)報(bào)出的數(shù)字分布情況。

扮演極端角色的智能體表現(xiàn)

在多樣化背景設(shè)置的模擬中，研究團(tuán)隊(duì)嘗試讓智能體扮演極端角色，例如七歲兒童。實(shí)驗(yàn)結(jié)果顯示，盡管智能體被設(shè)定為七歲兒童，但其行為并不符合預(yù)期，表現(xiàn)出計(jì)算和多步驟推理能力。這表明，盡管可以為智能體設(shè)置各種背景，但在某些極端情況下，智能體的行為可能與預(yù)期不符。

這一發(fā)現(xiàn)強(qiáng)調(diào)了在模擬前評(píng)估模型能力和設(shè)計(jì)背景設(shè)置的重要性。用戶(hù)需要仔細(xì)設(shè)計(jì)背景設(shè)置，并評(píng)估模型在特定角色下的表現(xiàn)，以確保模擬結(jié)果的現(xiàn)實(shí)性和代表性。

先驗(yàn)知識(shí)對(duì)智能體行為的影響

“猜平均數(shù)”的游戲是一個(gè)經(jīng)典的博弈論問(wèn)題，LLM可能在其訓(xùn)練語(yǔ)料中已經(jīng)獲得了相關(guān)的先驗(yàn)知識(shí)。為了測(cè)量這種先驗(yàn)知識(shí)的影響，研究團(tuán)隊(duì)改變了游戲的比例，從2/3改為1/2和51/100，并分別進(jìn)行了模擬實(shí)驗(yàn)。

實(shí)驗(yàn)結(jié)果顯示，當(dāng)比例設(shè)置為1/2和51/100時(shí)，智能體的表現(xiàn)存在顯著差異。更多的智能體在比例為1/2時(shí)傾向于報(bào)告較大的數(shù)字，而在比例為51/100時(shí)，智能體的表現(xiàn)則更加多樣化。這表明，LLM的先驗(yàn)知識(shí)對(duì)智能體行為有顯著影響。

為了減少這種影響，研究團(tuán)隊(duì)在系統(tǒng)提示中加入了一條注釋?zhuān)赋鲞@是“猜平均數(shù)”游戲的變體。實(shí)驗(yàn)結(jié)果顯示，加入注釋后，智能體的表現(xiàn)更加接近比例為1/2的情況。這一發(fā)現(xiàn)表明，通過(guò)在系統(tǒng)提示中明確說(shuō)明游戲設(shè)置，可以有效減少先驗(yàn)知識(shí)對(duì)智能體行為的影響。

非零納什均衡的模擬實(shí)驗(yàn)

為了驗(yàn)證智能體在理解和推理方面的能力，研究團(tuán)隊(duì)設(shè)置了一個(gè)變體游戲，使納什均衡變?yōu)?0，而不是經(jīng)典游戲中的0。實(shí)驗(yàn)結(jié)果顯示，部分使用Qwen2-72B和MistralAI-8×22B的智能體能夠在第一輪中推理出新的納什均衡點(diǎn)，并在隨后的游戲中逐漸接近10。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果，AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖14：當(dāng)我們?cè)谀M中將納什均衡改為 10 時(shí)報(bào)告的數(shù)字分布。

圖15：在 LLM 中使用不同溫度時(shí)報(bào)告的數(shù)字的分布。

這一發(fā)現(xiàn)表明，智能體在理解和推理方面表現(xiàn)出強(qiáng)大的能力，能夠根據(jù)新的游戲規(guī)則做出合理的決策。此外，實(shí)驗(yàn)還發(fā)現(xiàn)，盡管智能體在推理過(guò)程中可能會(huì)犯一些簡(jiǎn)單的計(jì)算錯(cuò)誤，但這些錯(cuò)誤并不影響整體結(jié)論。

通過(guò)這些實(shí)驗(yàn)，研究團(tuán)隊(duì)展示了AgentScope在大規(guī)模多智能體模擬中的強(qiáng)大能力和潛力。溫度對(duì)生成多樣性的影響、智能體扮演極端角色的表現(xiàn)、先驗(yàn)知識(shí)對(duì)智能體行為的影響以及非零納什均衡的模擬實(shí)驗(yàn)，進(jìn)一步驗(yàn)證了AgentScope在支持復(fù)雜模擬和多樣化智能體行為方面的有效性。

結(jié)論

論文通過(guò)對(duì)AgentScope平臺(tái)的詳細(xì)解讀，展示了其在超大規(guī)模多智能體模擬中的最新改進(jìn)和實(shí)驗(yàn)結(jié)果。AgentScope通過(guò)引入基于actor模型的分布式機(jī)制、靈活的環(huán)境支持、易用的配置工具和自動(dòng)背景生成管道，顯著提升了大規(guī)模多智能體模擬的擴(kuò)展性、效率和多樣性。

實(shí)驗(yàn)結(jié)果表明，AgentScope不僅能夠支持大規(guī)模智能體模擬，還能夠通過(guò)詳細(xì)的行為指導(dǎo)和多輪游戲中的策略調(diào)整，促使智能體進(jìn)行更深入的思考和更理性的決策。此外，溫度對(duì)生成多樣性的影響、智能體扮演極端角色的表現(xiàn)、先驗(yàn)知識(shí)對(duì)智能體行為的影響以及非零納什均衡的模擬實(shí)驗(yàn)，進(jìn)一步驗(yàn)證了AgentScope在支持復(fù)雜模擬和多樣化智能體行為方面的有效性。

未來(lái)，AgentScope有望在更多領(lǐng)域中得到應(yīng)用，如交通管理、金融市場(chǎng)模擬、災(zāi)害應(yīng)急響應(yīng)和社會(huì)行為研究等。通過(guò)不斷優(yōu)化平臺(tái)性能和擴(kuò)展應(yīng)用場(chǎng)景，AgentScope將為研究人員和開(kāi)發(fā)者提供更強(qiáng)大的工具，支持他們?cè)诖笠?guī)模多智能體模擬領(lǐng)域進(jìn)行創(chuàng)新和探索。（END）

參考資料：https://arxiv.org/pdf/2407.17789

本文轉(zhuǎn)載自 ??大噬元獸??，作者： FlerkenS

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

新型多智能體系統(tǒng)MESA，探索效率大幅提升

AI論文解讀 ? 4185瀏覽 ? 1回復(fù)
阿里巴巴AI研究團(tuán)隊(duì)打破視頻生成技術(shù)壁壘，EasyAnimate實(shí)現(xiàn)高質(zhì)量長(zhǎng)視頻生成

Syrupup ? 4313瀏覽 ? 0回復(fù)
阿里巴巴重磅開(kāi)源EasyAnimate！基于DiT的長(zhǎng)視頻制作生態(tài)系統(tǒng)

angel ? 5067瀏覽 ? 0回復(fù)
上海交大&阿里巴巴推出虛擬試衣新里程碑式工作——AnyFit：任意場(chǎng)景、任意組合！

angel ? 3247瀏覽 ? 0回復(fù)
阿里巴巴提出CODEXGRAPH：打破大模型與代碼庫(kù)的壁壘，引領(lǐng)軟件工程新革命

AI論文解讀 ? 4033瀏覽 ? 0回復(fù)
斯坦福大學(xué)和倫敦大學(xué)學(xué)院聯(lián)合打造多智能體系統(tǒng)中的安全防線，應(yīng)對(duì)大模型即時(shí)感染

xuxiangda ? 3644瀏覽 ? 0回復(fù)
阿里巴巴達(dá)摩院、新加坡科技設(shè)計(jì)大學(xué)和南洋理工大學(xué)聯(lián)合團(tuán)隊(duì)提升AI多步推理能力的新方法

xuxiangda ? 2834瀏覽 ? 0回復(fù)
大模型真能模擬人類(lèi)語(yǔ)言？中國(guó)人民大學(xué)提出新的數(shù)據(jù)增強(qiáng)方法

AI論文解讀 ? 2730瀏覽 ? 0回復(fù)
阿里巴巴研究院推出 XiYan-SQL：用于Text-to-SQL的多生成器集成人工智能框架

Halo咯咯 ? 8095瀏覽 ? 0回復(fù)
阿里巴巴Qwen團(tuán)隊(duì)發(fā)布QwQ-32B-Preview：包含320億參數(shù)的開(kāi)放模型，專(zhuān)為解決高級(jí)推理任務(wù)而設(shè)計(jì)

Halo咯咯 ? 5115瀏覽 ? 0回復(fù)
中山大學(xué)、美團(tuán)聯(lián)合團(tuán)隊(duì)推出行為正則化與順序策略?xún)?yōu)化結(jié)合的離線多智能體學(xué)習(xí)算法

xuxiangda ? 2820瀏覽 ? 0回復(fù)
中國(guó)科學(xué)院軟件研究所聯(lián)合團(tuán)隊(duì)通過(guò)反事實(shí)推理解鎖多智能體系統(tǒng)中的智能體行為

xuxiangda ? 3019瀏覽 ? 0回復(fù)
阿里巴巴語(yǔ)音實(shí)驗(yàn)室發(fā)布開(kāi)源語(yǔ)音處理框架ClearerVoice-Studio，支持語(yǔ)音增強(qiáng)、分離、目標(biāo)說(shuō)話人提取

Halo咯咯 ? 3561瀏覽 ? 0回復(fù)
突破與超越：CosyVoice 2.0—阿里巴巴通義實(shí)驗(yàn)室的語(yǔ)音進(jìn)階新作

穿越時(shí)空111 ? 5436瀏覽 ? 0回復(fù)
阿里巴巴語(yǔ)音實(shí)驗(yàn)室發(fā)布新成果，多模態(tài)方法顯著提升視頻主題分割性能

xuxiangda ? 2642瀏覽 ? 0回復(fù)
阿里巴巴Qwen研究員推出ProcessBench：衡量數(shù)學(xué)推理過(guò)程錯(cuò)誤識(shí)別能力的新AI基準(zhǔn)

Halo咯咯 ? 2455瀏覽 ? 0回復(fù)
阿里巴巴AI研究院發(fā)布CosyVoice 2：改進(jìn)的流式語(yǔ)音合成模型

Halo咯咯 ? 4752瀏覽 ? 0回復(fù)
斯坦福大學(xué)團(tuán)隊(duì)使用多智能體強(qiáng)化學(xué)習(xí)訓(xùn)練社交推理語(yǔ)言模型

xuxiangda ? 2561瀏覽 ? 0回復(fù)
AI Hospital(人工智能醫(yī)院)：在多智能體醫(yī)療互動(dòng)模擬器中評(píng)估大模型的表現(xiàn) - 阿里、華中科技等

知識(shí)圖譜科技 ? 1577瀏覽 ? 0回復(fù)

這個(gè)用戶(hù)很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門(mén)推薦

具備記憶的智能體操作系統(tǒng)，MemoryOS重構(gòu)AI Agent對(duì)話的持久性與個(gè)性化 0回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題 0回復(fù)

AI Agents開(kāi)源工具棧全解析~ 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測(cè)：真·超DS！ 1回復(fù)

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復(fù)

上一篇：人類(lèi)和大模型的語(yǔ)言發(fā)展和使用過(guò)程是否不同？Psychomatics框架對(duì)人工智能與人類(lèi)認(rèn)知展開(kāi)對(duì)比研究

下一篇：第一人稱(chēng)基礎(chǔ)模型——情感與生理數(shù)據(jù)在AI中的應(yīng)用

社區(qū)精華內(nèi)容

目錄

<table id="gkc6f"></table>

<rp id="gkc6f"></rp>

<center id="gkc6f"></center>