偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率

發(fā)布于 2024-7-31 00:46
瀏覽
0收藏

多智能體系統(tǒng)(MAS)是一種通過(guò)多個(gè)智能體的協(xié)作來(lái)解決復(fù)雜問(wèn)題的技術(shù)。這些智能體可以是軟件代理、機(jī)器人或其他自主系統(tǒng),能夠在動(dòng)態(tài)環(huán)境中進(jìn)行交互和決策。MAS在許多領(lǐng)域有廣泛的應(yīng)用,包括交通管理、金融市場(chǎng)模擬、災(zāi)害應(yīng)急響應(yīng)、社會(huì)行為研究等。隨著應(yīng)用規(guī)模的擴(kuò)大,現(xiàn)有的多智能體系統(tǒng)面臨擴(kuò)展性和效率問(wèn)題、智能體多樣性不足、管理過(guò)程復(fù)雜的問(wèn)題。

近日由來(lái)自阿里巴巴集團(tuán)和中國(guó)人民大學(xué)組成的聯(lián)合研究團(tuán)隊(duì)推出AgentScope平臺(tái),對(duì)超大規(guī)模多智能體模擬中的最新改進(jìn)取得非常的技術(shù)成果。AgentScope是一個(gè)用戶(hù)友好的多智能體平臺(tái),旨在解決現(xiàn)有平臺(tái)在擴(kuò)展性、效率、智能體多樣性和管理過(guò)程方面的挑戰(zhàn)。通過(guò)引入基于actor模型的分布式機(jī)制、靈活的環(huán)境支持、易用的配置工具和自動(dòng)背景生成管道,AgentScope顯著提升了大規(guī)模多智能體模擬的便利性和靈活性。

同時(shí),研究團(tuán)隊(duì)發(fā)表的論文《Very Large-Scale Multi-Agent Simulation in AgentScope》探討了大規(guī)模多智能體模擬在不同領(lǐng)域的潛力,通過(guò)一系列綜合模擬實(shí)驗(yàn),展示AgentScope在支持大規(guī)模多智能體模擬方面的有效性,并提供詳細(xì)的觀察和討論,強(qiáng)調(diào)多智能體系統(tǒng)在大規(guī)模模擬中的巨大潛力。

研究團(tuán)隊(duì)里阿里巴巴集團(tuán)的人員有Xuchen Pan、Dawei Gao、Yuexiang Xie、Yaliang Li、Bolin Ding、Jingren Zhou,這些研究人員在阿里巴巴集團(tuán)工作,專(zhuān)注于大規(guī)模多智能體系統(tǒng)和相關(guān)技術(shù)的研究與開(kāi)發(fā)。中國(guó)人民大學(xué)的人員有Zhewei Wei、Ji-Rong Wen,這兩位研究人員來(lái)自中國(guó)人民大學(xué),致力于多智能體系統(tǒng)和人工智能領(lǐng)域的研究。

論文的源代碼已在GitHub上發(fā)布(鏈接地址https://github.com/modelscope/agentscope),該項(xiàng)目在GitHub上有3.9k顆星和249個(gè)分支。這一開(kāi)源項(xiàng)目為研究人員和開(kāi)發(fā)者提供了一個(gè)強(qiáng)大的工具,支持他們?cè)诖笠?guī)模多智能體模擬領(lǐng)域進(jìn)行創(chuàng)新和探索。

多智能體系統(tǒng)的現(xiàn)狀與挑戰(zhàn)

多智能體系統(tǒng)(MAS)在許多領(lǐng)域中都有廣泛的應(yīng)用,如交通管理、金融市場(chǎng)模擬、災(zāi)害應(yīng)急響應(yīng)和社會(huì)行為研究等。然而,現(xiàn)有的多智能體模擬平臺(tái)在擴(kuò)展性、效率、智能體多樣性和管理過(guò)程等方面仍存在諸多局限性。

隨著智能體數(shù)量的增加,現(xiàn)有平臺(tái)在組織智能體執(zhí)行任務(wù)和通信方面的效率顯著下降。在大規(guī)模模擬中,智能體需要按照一定的順序執(zhí)行任務(wù),并進(jìn)行頻繁的通信和協(xié)作。然而,現(xiàn)有平臺(tái)在處理大量智能體時(shí),往往難以高效地組織這些任務(wù),導(dǎo)致模擬時(shí)間過(guò)長(zhǎng),結(jié)果不準(zhǔn)確。大規(guī)模模擬需要大量的計(jì)算資源,現(xiàn)有平臺(tái)在資源分配和利用方面存在不足,無(wú)法充分利用多核處理器和分布式計(jì)算資源,導(dǎo)致計(jì)算效率低下。智能體之間的通信是多智能體系統(tǒng)的重要組成部分,但在大規(guī)模模擬中,通信開(kāi)銷(xiāo)往往成為瓶頸,限制了系統(tǒng)的擴(kuò)展性和效率。

大規(guī)模模擬需要智能體表現(xiàn)出多樣化的行為,以便更真實(shí)地再現(xiàn)復(fù)雜系統(tǒng)的行為。然而現(xiàn)有平臺(tái)在智能體背景設(shè)置和行為多樣性方面的支持有限,現(xiàn)有平臺(tái)通常只提供簡(jiǎn)單的背景設(shè)置,難以生成具有豐富背景和多樣化行為的智能體。這使得模擬結(jié)果缺乏現(xiàn)實(shí)性和代表性。由于背景設(shè)置的單一性,智能體的行為模式往往趨于同質(zhì)化,難以模擬真實(shí)世界中的復(fù)雜場(chǎng)景和多樣化行為?,F(xiàn)有平臺(tái)在智能體間的互動(dòng)設(shè)計(jì)上存在不足,難以支持復(fù)雜的互動(dòng)行為和動(dòng)態(tài)變化,限制了模擬的深度和廣度。

管理大量分布在多個(gè)設(shè)備上的智能體,包括初始化、執(zhí)行和終止智能體,以及監(jiān)控其狀態(tài)和交互,過(guò)程繁瑣且耗時(shí)。在大規(guī)模模擬中,初始化和配置大量智能體需要耗費(fèi)大量時(shí)間和精力,現(xiàn)有平臺(tái)缺乏高效的配置工具和自動(dòng)化支持。在模擬執(zhí)行過(guò)程中,監(jiān)控智能體的狀態(tài)和行為是一個(gè)復(fù)雜的任務(wù),現(xiàn)有平臺(tái)在監(jiān)控工具和界面設(shè)計(jì)上存在不足,難以提供全面和實(shí)時(shí)的監(jiān)控。在模擬結(jié)束后,終止和清理大量智能體同樣是一個(gè)耗時(shí)的過(guò)程,現(xiàn)有平臺(tái)缺乏高效的終止和清理機(jī)制。

為了提升多智能體模擬的現(xiàn)實(shí)性和可靠性,減少人力干預(yù),論文提出了對(duì)AgentScope平臺(tái)的多項(xiàng)改進(jìn),旨在解決上述挑戰(zhàn),支持超大規(guī)模多智能體模擬。

通過(guò)引入基于actor模型的分布式機(jī)制、靈活的環(huán)境支持、易用的配置工具和自動(dòng)背景生成管道,AgentScope顯著提升了大規(guī)模多智能體模擬的現(xiàn)實(shí)性和可靠性。基于actor模型的分布式架構(gòu)支持自動(dòng)并行執(zhí)行和集中工作流編排,顯著提升了模擬的擴(kuò)展性和效率。多層環(huán)境結(jié)構(gòu)和高頻訪問(wèn)支持能夠靈活模擬各種現(xiàn)實(shí)場(chǎng)景,增強(qiáng)了模擬的現(xiàn)實(shí)性。配置工具和自動(dòng)背景生成管道簡(jiǎn)化了創(chuàng)建多樣化智能體的過(guò)程,提升了智能體的多樣性和行為的現(xiàn)實(shí)性。

通過(guò)提供易用的配置工具和自動(dòng)化支持,AgentScope顯著減少了大規(guī)模多智能體模擬中的人力干預(yù)。用戶(hù)可以定義模擬的總?cè)丝?,并從多個(gè)角度指定人口分布,提供常用的分布模板,支持?jǐn)U展新的方面,簡(jiǎn)化了智能體的初始化和配置過(guò)程。根據(jù)配置工具提供的分布,自動(dòng)生成詳細(xì)且多樣化的背景設(shè)置,引入更多多樣性,減少了手動(dòng)設(shè)置的工作量?;赪eb的界面提供了全面和實(shí)時(shí)的監(jiān)控,簡(jiǎn)化了智能體的執(zhí)行和監(jiān)控過(guò)程,提高了管理效率。

AgentScope平臺(tái)的改進(jìn)

AgentScope平臺(tái)在大規(guī)模多智能體模擬中引入了多項(xiàng)關(guān)鍵改進(jìn),旨在解決現(xiàn)有平臺(tái)在擴(kuò)展性、效率、智能體多樣性和管理過(guò)程方面的挑戰(zhàn)。

分布式機(jī)制

AgentScope采用了基于actor模型的分布式架構(gòu),這種架構(gòu)在并行計(jì)算和分布式系統(tǒng)中具有顯著優(yōu)勢(shì)。actor模型是一種并發(fā)計(jì)算的數(shù)學(xué)模型,其中每個(gè)actor作為基本計(jì)算單元,獨(dú)立接收消息并進(jìn)行計(jì)算。通過(guò)這種方式,AgentScope能夠?qū)崿F(xiàn)高效的任務(wù)分配和執(zhí)行。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖1:自動(dòng)并行執(zhí)行的一個(gè)示例,其中圓圈表示代理,有向邊表示消息傳遞流。

在AgentScope中,每個(gè)智能體被視為一個(gè)獨(dú)立的actor,能夠并行執(zhí)行任務(wù)并與其他智能體進(jìn)行通信。這種設(shè)計(jì)不僅提高了系統(tǒng)的擴(kuò)展性,還減少了任務(wù)執(zhí)行的時(shí)間。具體來(lái)說(shuō),AgentScope通過(guò)通信圖動(dòng)態(tài)識(shí)別可執(zhí)行的智能體,這些智能體可以自動(dòng)并行執(zhí)行,利用最大可用資源。

為了進(jìn)一步提升效率,AgentScope引入了自動(dòng)并行執(zhí)行和集中工作流編排機(jī)制。自動(dòng)并行執(zhí)行通過(guò)格式化智能體間的交互為通信圖,實(shí)現(xiàn)了智能體的并行執(zhí)行。每個(gè)智能體在接收到所需的消息后才會(huì)觸發(fā)內(nèi)部計(jì)算,這樣可以確保智能體僅依賴(lài)于必要的消息,從而實(shí)現(xiàn)高效的并行執(zhí)行。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖2:占位符如何在模擬中發(fā)揮作用,以使用戶(hù)能夠集中協(xié)調(diào)工作流程。

集中工作流編排則通過(guò)代理機(jī)制在中心進(jìn)程中管理分布式智能體的通信。代理機(jī)制隱藏了遠(yuǎn)程計(jì)算的復(fù)雜性,使用戶(hù)能夠在中心進(jìn)程中指定分布式智能體之間的通信。為了確保工作流執(zhí)行不被分布式智能體的計(jì)算阻塞,AgentScope引入了占位符概念。當(dāng)代理接收到消息時(shí),會(huì)立即返回占位符,并將消息轉(zhuǎn)發(fā)給對(duì)應(yīng)的分布式智能體。智能體在接收到所有實(shí)際值后才會(huì)執(zhí)行內(nèi)部計(jì)算,從而實(shí)現(xiàn)了獨(dú)立分布式智能體的并行運(yùn)行。

這種設(shè)計(jì)不僅提高了智能體間通信的效率,還簡(jiǎn)化了用戶(hù)的操作,使得大規(guī)模多智能體模擬變得更加便捷和高效。

靈活的環(huán)境支持

AgentScope提供了多層環(huán)境結(jié)構(gòu),支持組內(nèi)信息同步和組間信息差異化,增強(qiáng)了模擬的靈活性。在多智能體模擬中,環(huán)境是智能體交互的重要組成部分。AgentScope通過(guò)抽象環(huán)境操作為注冊(cè)、查詢(xún)、更新、刪除和監(jiān)控等基本操作,支持高頻訪問(wèn)和數(shù)據(jù)同步。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖3:基于代理的模擬的多層環(huán)境結(jié)構(gòu)。

多層環(huán)境結(jié)構(gòu)允許為不同的智能體組建立獨(dú)立的環(huán)境,以提供交互項(xiàng)和共享信息。在這些環(huán)境之上,還可以設(shè)置一個(gè)全局環(huán)境進(jìn)行全局同步。這種設(shè)計(jì)特別適用于需要組內(nèi)協(xié)作和組間信息差異化的模擬場(chǎng)景,例如社會(huì)行為模擬和團(tuán)隊(duì)合作模擬。

為了滿(mǎn)足大規(guī)模模擬中高頻訪問(wèn)的需求,AgentScope實(shí)現(xiàn)了分布式節(jié)點(diǎn)的環(huán)境模塊,通過(guò)遠(yuǎn)程過(guò)程調(diào)用(RPC)與智能體進(jìn)行通信。環(huán)境模塊在接收到智能體的請(qǐng)求后,會(huì)根據(jù)訪問(wèn)的數(shù)據(jù)將請(qǐng)求分類(lèi)到不同的隊(duì)列中,并同時(shí)處理這些隊(duì)列中的請(qǐng)求,以解決數(shù)據(jù)沖突問(wèn)題。

用戶(hù)可以根據(jù)可用的硬件資源設(shè)置最大并發(fā)數(shù),從而優(yōu)化環(huán)境模塊的性能。此外,AgentScope還提供了時(shí)間線和位置兩個(gè)維度的交互,支持智能體根據(jù)全局時(shí)間調(diào)整行為,并在地圖上與附近的智能體或物品進(jìn)行交互。這種設(shè)計(jì)提供了靈活的環(huán)境支持,能夠模擬各種現(xiàn)實(shí)場(chǎng)景,增強(qiáng)了模擬的現(xiàn)實(shí)性和多樣性。

易用的配置工具與自動(dòng)背景生成

AgentScope集成了易用的配置工具,用戶(hù)可以定義模擬的總?cè)丝?,并從多個(gè)角度指定人口分布。配置工具提供了一些常用的分布模板,例如年齡、性別、職業(yè)、國(guó)籍和教育水平等,用戶(hù)也可以根據(jù)需要擴(kuò)展新的方面。

通過(guò)配置工具,用戶(hù)只需簡(jiǎn)單地指定人口分布,即可生成大量具有詳細(xì)且多樣化特征的智能體。這些智能體可以通過(guò)AgentScope-Manager模塊方便地管理和監(jiān)控,該模塊簡(jiǎn)化了大規(guī)模智能體模擬的組織和觀察過(guò)程。

在配置工具提供的分布基礎(chǔ)上,AgentScope還提供了自動(dòng)背景生成管道,用于生成詳細(xì)且多樣化的背景設(shè)置。當(dāng)用戶(hù)啟動(dòng)模擬時(shí),系統(tǒng)會(huì)根據(jù)配置工具提供的分布,從中抽取具體值,并將其轉(zhuǎn)換為JSON格式,填充到元提示中,生成完整的背景設(shè)置指令。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖4:基于網(wǎng)頁(yè)的可視化界面,適用于大規(guī)模代理商管理。

這些指令由大語(yǔ)言模型(LLMs)使用,以生成異構(gòu)的背景設(shè)置。為了引入更多的多樣性,生成過(guò)程會(huì)調(diào)整隨機(jī)種子和溫度。通過(guò)這種方式,AgentScope能夠自動(dòng)生成具有豐富背景和多樣化行為的智能體,減少了手動(dòng)設(shè)置的工作量,提高了模擬的現(xiàn)實(shí)性和代表性。

AgentScope通過(guò)引入基于actor模型的分布式機(jī)制、靈活的環(huán)境支持、易用的配置工具和自動(dòng)背景生成管道,顯著提升了大規(guī)模多智能體模擬的擴(kuò)展性、效率和多樣性。這些改進(jìn)不僅解決了現(xiàn)有平臺(tái)的局限性,還為研究人員和開(kāi)發(fā)者提供了一個(gè)強(qiáng)大的工具,支持他們?cè)诖笠?guī)模多智能體模擬領(lǐng)域進(jìn)行創(chuàng)新和探索。

實(shí)驗(yàn)與結(jié)果分析

研究團(tuán)隊(duì)通過(guò)一系列實(shí)驗(yàn)驗(yàn)證了AgentScope在大規(guī)模多智能體模擬中的性能和效果。以下是實(shí)驗(yàn)設(shè)置、擴(kuò)展性與效率分析以及模擬結(jié)果與分析的詳細(xì)解讀。

實(shí)驗(yàn)設(shè)置

實(shí)驗(yàn)在一個(gè)包含多個(gè)設(shè)備的集群上進(jìn)行,每個(gè)設(shè)備配備8個(gè)A100-80G GPU、64核CPU和1TB內(nèi)存。為了處理高并發(fā)的服務(wù)請(qǐng)求,研究團(tuán)隊(duì)采用了vLLM作為L(zhǎng)LM推理引擎。實(shí)驗(yàn)中使用了六種不同大小的開(kāi)源LLM,包括Llama3-8B、Llama3-70B、Qwen2-7B、Qwen2-72B、MistralAI-8×7B和MistralAI-8×22B。

在實(shí)驗(yàn)中,除非特別說(shuō)明,每個(gè)設(shè)備上部署八個(gè)Qwen2-7B或Llama3-8B模型,兩個(gè)Qwen2-72B、Llama3-70B或MistralAI-8×7B模型,或一個(gè)MistralAI-8×22B模型。所有LLM的生成溫度設(shè)置為1.0,以促進(jìn)響應(yīng)的多樣性。此外,為了防止響應(yīng)格式錯(cuò)誤,每個(gè)智能體在每輪游戲中執(zhí)行兩次LLM服務(wù)器調(diào)用。第一次調(diào)用用于生成響應(yīng),包括其思維過(guò)程和報(bào)告的數(shù)字,第二次調(diào)用用于正確提取報(bào)告的數(shù)字。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖5:基于代理的模擬,具有不同規(guī)模的代理(a、b)和不同數(shù)量的設(shè)備(c、d)。

為了指導(dǎo)智能體在游戲中的行為,研究團(tuán)隊(duì)為智能體提供了系統(tǒng)提示。這些提示包括游戲規(guī)則、響應(yīng)格式以及行為指導(dǎo)。例如,為了鼓勵(lì)智能體逐步思考,系統(tǒng)提示中加入了“鏈?zhǔn)剿季S”研究的啟發(fā),要求智能體在報(bào)告數(shù)字前逐步思考。

在進(jìn)一步的實(shí)驗(yàn)中,研究團(tuán)隊(duì)還在系統(tǒng)提示中加入了更詳細(xì)的行為指導(dǎo),提醒智能體所有競(jìng)爭(zhēng)對(duì)手都是理性的,并會(huì)通過(guò)分析他人的策略來(lái)調(diào)整報(bào)告的數(shù)字。這些詳細(xì)指令旨在使智能體在報(bào)告數(shù)字前進(jìn)行更深入的思考和多樣化的考慮,從而使模擬更加實(shí)際、有意義和有趣。

擴(kuò)展性與效率

為了展示AgentScope在大規(guī)模智能體模擬中的擴(kuò)展性和效率,研究團(tuán)隊(duì)進(jìn)行了多項(xiàng)實(shí)驗(yàn),記錄了不同規(guī)模智能體模擬的運(yùn)行時(shí)間。實(shí)驗(yàn)結(jié)果顯示,AgentScope能夠支持包含100萬(wàn)個(gè)智能體的模擬,使用4臺(tái)設(shè)備可在12分鐘內(nèi)完成。

具體來(lái)說(shuō),當(dāng)使用Llama3-8B和基本系統(tǒng)提示(Prompt 1)時(shí),模擬包含100萬(wàn)個(gè)智能體的運(yùn)行時(shí)間為12分鐘;而使用“鏈?zhǔn)剿季S”提示(Prompt 2)時(shí),由于響應(yīng)的平均令牌數(shù)增加了150倍以上,運(yùn)行時(shí)間增加到85分鐘。對(duì)于最重的推理工作負(fù)載,即使用Llama3-70B和Prompt 2時(shí),模擬運(yùn)行時(shí)間約為10.6小時(shí)。

為了更好地展示基于actor模型的分布式機(jī)制帶來(lái)的效率提升,研究團(tuán)隊(duì)采用了虛擬模型請(qǐng)求(即智能體休眠1秒并生成隨機(jī)數(shù)而不是發(fā)送請(qǐng)求)進(jìn)行模擬,以消除LLM推理速度的影響。實(shí)驗(yàn)結(jié)果顯示,使用基于actor模型的分布式機(jī)制,完成包含100萬(wàn)個(gè)智能體的模擬僅需40秒,而使用串行執(zhí)行或Python中的異步模式(現(xiàn)有工作采用的模式)則分別需要約12天和8.6小時(shí)。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖6:具有不同 LLM 和系統(tǒng)提示的代理報(bào)告的數(shù)字分布。

此外,增加設(shè)備數(shù)量可以成比例地減少模擬運(yùn)行時(shí)間。例如,當(dāng)智能體數(shù)量固定為10,000時(shí),增加設(shè)備數(shù)量從1臺(tái)到4臺(tái),模擬運(yùn)行時(shí)間從22分鐘減少到5.6分鐘。這表明,通過(guò)增加設(shè)備數(shù)量,AgentScope能夠顯著提升模擬的擴(kuò)展性和效率。

模擬結(jié)果與分析

實(shí)驗(yàn)結(jié)果顯示,不同系統(tǒng)提示對(duì)智能體的行為有顯著影響。使用基本系統(tǒng)提示(Prompt 1)時(shí),大多數(shù)智能體報(bào)告的數(shù)字約為50。然而使用“鏈?zhǔn)剿季S”提示(Prompt 2)時(shí),智能體報(bào)告的數(shù)字顯著減少,接近0。這表明詳細(xì)指令比一般指導(dǎo)(如“逐步思考”)更有效,能夠促使智能體進(jìn)行更深入的思考和更理性的決策。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖7:多輪比賽中報(bào)告數(shù)字的平均值。

在進(jìn)一步的實(shí)驗(yàn)中,研究團(tuán)隊(duì)在系統(tǒng)提示中加入了更詳細(xì)的行為指導(dǎo)(Prompt 3和Prompt 4),提醒智能體所有競(jìng)爭(zhēng)對(duì)手都是理性的,并會(huì)通過(guò)分析他人的策略來(lái)調(diào)整報(bào)告的數(shù)字。實(shí)驗(yàn)結(jié)果顯示,使用詳細(xì)指令的智能體報(bào)告的數(shù)字更接近0,表明詳細(xì)指令比一般指導(dǎo)更有效。

在多輪游戲中,智能體逐漸調(diào)整策略,報(bào)告的數(shù)字逐漸收斂到0,顯示出對(duì)游戲的良好理解和理性決策能力。例如,在多輪游戲中,智能體在每輪開(kāi)始時(shí)會(huì)被告知上一輪的獲勝數(shù)字,并根據(jù)這些信息調(diào)整策略。實(shí)驗(yàn)結(jié)果顯示,隨著游戲的進(jìn)行,智能體報(bào)告的數(shù)字逐漸接近0,表明智能體能夠有效地考慮其他智能體的行為,并做出合理的決策。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖8:不同的系統(tǒng)提示對(duì)不同的LLM的影響。

此外,使用“鏈?zhǔn)剿季S”提示的智能體比使用基本提示的智能體更快收斂到納什均衡。例如,在第五輪游戲中,使用Qwen2-72B和Prompt 2的智能體報(bào)告的平均數(shù)字為2.02,而使用Prompt 1的智能體報(bào)告的平均數(shù)字為25.16。這表明,詳細(xì)的行為指導(dǎo)能夠加速智能體達(dá)到納什均衡。

智能體多樣性研究

在多智能體系統(tǒng)的研究中,智能體的多樣性是一個(gè)關(guān)鍵因素。多樣化的智能體能夠更真實(shí)地模擬復(fù)雜系統(tǒng)中的各種行為和交互,從而提高模擬的現(xiàn)實(shí)性和代表性。研究團(tuán)隊(duì)通過(guò)對(duì)AgentScope平臺(tái)的實(shí)驗(yàn),深入探討了智能體多樣性的重要性及其實(shí)現(xiàn)方法。

異構(gòu)配置

在AgentScope平臺(tái)中,研究團(tuán)隊(duì)通過(guò)配置工具和自動(dòng)背景生成管道,為智能體設(shè)置了多樣化的背景,包括教育水平和職業(yè)背景。具體來(lái)說(shuō),智能體被分為多個(gè)組,每組包含200個(gè)智能體,每個(gè)組的智能體具有不同的教育水平或職業(yè)背景。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖9:具有不同教育水平的代理人報(bào)告的數(shù)字分布。

在教育水平方面,智能體被分為五個(gè)不同的教育水平:小學(xué)、高中、學(xué)士、碩士和博士。實(shí)驗(yàn)結(jié)果顯示,教育水平越高的智能體在游戲中的表現(xiàn)越理性。例如,使用Qwen2-72B的智能體中,博士教育水平的智能體報(bào)告的平均數(shù)字顯著低于小學(xué)教育水平的智能體。這表明,教育水平較高的智能體在游戲中表現(xiàn)出更強(qiáng)的推理能力和決策能力。

在職業(yè)背景方面,智能體被分為六個(gè)不同的職業(yè):游戲理論教授、經(jīng)濟(jì)學(xué)家、心理學(xué)家、運(yùn)動(dòng)員、藝術(shù)家和作家。實(shí)驗(yàn)結(jié)果顯示,不同職業(yè)背景的智能體在游戲中的表現(xiàn)也存在顯著差異。例如,游戲理論教授和經(jīng)濟(jì)學(xué)家報(bào)告的數(shù)字較小,表現(xiàn)出更理性的行為;而藝術(shù)家和作家則可能采用更直接的策略。這些結(jié)果表明,智能體的職業(yè)背景對(duì)其行為有重要影響。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖10:不同職業(yè)的代理人報(bào)告的數(shù)字分布。

圖11:涉及具有多種 LLM 的代理的個(gè)體級(jí)別模擬。

通過(guò)對(duì)不同背景設(shè)置的智能體行為進(jìn)行分析,研究團(tuán)隊(duì)發(fā)現(xiàn),智能體的行為與其背景設(shè)置一致。例如,具有博士教育水平的智能體在游戲中表現(xiàn)出更強(qiáng)的推理能力和決策能力,而小學(xué)教育水平的智能體則可能表現(xiàn)出較為簡(jiǎn)單的行為模式。同樣,游戲理論教授和經(jīng)濟(jì)學(xué)家在游戲中表現(xiàn)出更理性的行為,而藝術(shù)家和作家則可能采用更直接的策略。

這些結(jié)果表明,通過(guò)提供不同的背景描述,可以顯著增強(qiáng)智能體的多樣性,從而提高模擬的現(xiàn)實(shí)性和代表性。AgentScope平臺(tái)的配置工具和自動(dòng)背景生成管道為實(shí)現(xiàn)這一目標(biāo)提供了有力支持。

混合LLM的模擬實(shí)驗(yàn)

為了進(jìn)一步探討智能體多樣性,研究團(tuán)隊(duì)進(jìn)行了混合LLM的模擬實(shí)驗(yàn)。具體來(lái)說(shuō),智能體被配置為使用不同的LLM,包括Llama3-70B、MistralAI-8×22B和Qwen2-72B,每個(gè)LLM分配500個(gè)智能體。實(shí)驗(yàn)包括個(gè)體級(jí)別和組級(jí)別的模擬。

在個(gè)體級(jí)別模擬中,每個(gè)智能體獨(dú)立參與游戲。實(shí)驗(yàn)結(jié)果顯示,不同LLM的智能體行為存在顯著差異。例如,Llama3-70B的智能體報(bào)告的數(shù)字較為一致,傾向于報(bào)告約33的數(shù)字;MistralAI-8×22B的智能體則一致報(bào)告0;Qwen2-72B的智能體表現(xiàn)出更大的行為多樣性,報(bào)告的數(shù)字范圍較廣,主要集中在0到50之間。

在組級(jí)別模擬中,智能體被分為三組,每組使用相同的LLM。每個(gè)智能體報(bào)告一個(gè)數(shù)字,組內(nèi)智能體的平均數(shù)字作為該組的報(bào)告數(shù)字。實(shí)驗(yàn)結(jié)果顯示,同組智能體的行為在第二輪后趨于一致。例如,Qwen2-72B和Llama3-70B的智能體表現(xiàn)較為一致,而MistralAI-8×22B的智能體有時(shí)會(huì)報(bào)告較大的數(shù)字。

實(shí)驗(yàn)結(jié)果表明,不同LLM的智能體在行為上存在顯著差異。例如,Llama3-70B的智能體報(bào)告的數(shù)字較為一致,而MistralAI-8×22B的智能體則一致報(bào)告0,Qwen2-72B的智能體表現(xiàn)出更大的行為多樣性。這些差異可能與LLM的架構(gòu)、訓(xùn)練語(yǔ)料等因素有關(guān)。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖12:涉及具有混合 LLM 的代理的群體級(jí)別模擬。

此外實(shí)驗(yàn)還顯示,智能體在多輪游戲中的策略調(diào)整也存在差異。例如,在多輪游戲中,智能體在每輪開(kāi)始時(shí)會(huì)被告知上一輪的獲勝數(shù)字,并根據(jù)這些信息調(diào)整策略。實(shí)驗(yàn)結(jié)果顯示,隨著游戲的進(jìn)行,智能體報(bào)告的數(shù)字逐漸接近0,表明智能體能夠有效地考慮其他智能體的行為,并做出合理的決策。

進(jìn)一步討論

在論文的最后部分,我們將進(jìn)一步探討AgentScope在大規(guī)模多智能體模擬中的一些關(guān)鍵問(wèn)題和實(shí)驗(yàn)結(jié)果。這些討論將涵蓋溫度對(duì)生成多樣性的影響、智能體扮演極端角色的表現(xiàn)、先驗(yàn)知識(shí)對(duì)智能體行為的影響以及非零納什均衡的模擬實(shí)驗(yàn)。

溫度對(duì)生成多樣性的影響

溫度是控制大語(yǔ)言模型(LLM)生成多樣性的一個(gè)重要超參數(shù)。在AgentScope的實(shí)驗(yàn)中,研究團(tuán)隊(duì)設(shè)置了1000個(gè)使用Qwen2-72B和Prompt 2的智能體,并將溫度范圍設(shè)置為{0.05, 0.25, 0.50, 1.00}。實(shí)驗(yàn)結(jié)果顯示,隨著溫度的增加,報(bào)告數(shù)字的標(biāo)準(zhǔn)差從6.50上升到8.20,而平均值變化不大。

這些結(jié)果表明,溫度對(duì)生成多樣性的影響主要體現(xiàn)在報(bào)告數(shù)字的分布上,而對(duì)總體平均值的影響較小。當(dāng)溫度較低時(shí),智能體的行為較為一致,報(bào)告的數(shù)字集中在一個(gè)較小的范圍內(nèi);而當(dāng)溫度較高時(shí),智能體的行為變得更加多樣化,報(bào)告的數(shù)字分布范圍更廣。這一發(fā)現(xiàn)對(duì)于在大規(guī)模模擬中控制智能體行為的多樣性具有重要意義。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖13:游戲中設(shè)定不同比例時(shí)報(bào)出的數(shù)字分布情況。

扮演極端角色的智能體表現(xiàn)

在多樣化背景設(shè)置的模擬中,研究團(tuán)隊(duì)嘗試讓智能體扮演極端角色,例如七歲兒童。實(shí)驗(yàn)結(jié)果顯示,盡管智能體被設(shè)定為七歲兒童,但其行為并不符合預(yù)期,表現(xiàn)出計(jì)算和多步驟推理能力。這表明,盡管可以為智能體設(shè)置各種背景,但在某些極端情況下,智能體的行為可能與預(yù)期不符。

這一發(fā)現(xiàn)強(qiáng)調(diào)了在模擬前評(píng)估模型能力和設(shè)計(jì)背景設(shè)置的重要性。用戶(hù)需要仔細(xì)設(shè)計(jì)背景設(shè)置,并評(píng)估模型在特定角色下的表現(xiàn),以確保模擬結(jié)果的現(xiàn)實(shí)性和代表性。

先驗(yàn)知識(shí)對(duì)智能體行為的影響

“猜平均數(shù)”的游戲是一個(gè)經(jīng)典的博弈論問(wèn)題,LLM可能在其訓(xùn)練語(yǔ)料中已經(jīng)獲得了相關(guān)的先驗(yàn)知識(shí)。為了測(cè)量這種先驗(yàn)知識(shí)的影響,研究團(tuán)隊(duì)改變了游戲的比例,從2/3改為1/2和51/100,并分別進(jìn)行了模擬實(shí)驗(yàn)。

實(shí)驗(yàn)結(jié)果顯示,當(dāng)比例設(shè)置為1/2和51/100時(shí),智能體的表現(xiàn)存在顯著差異。更多的智能體在比例為1/2時(shí)傾向于報(bào)告較大的數(shù)字,而在比例為51/100時(shí),智能體的表現(xiàn)則更加多樣化。這表明,LLM的先驗(yàn)知識(shí)對(duì)智能體行為有顯著影響。

為了減少這種影響,研究團(tuán)隊(duì)在系統(tǒng)提示中加入了一條注釋?zhuān)赋鲞@是“猜平均數(shù)”游戲的變體。實(shí)驗(yàn)結(jié)果顯示,加入注釋后,智能體的表現(xiàn)更加接近比例為1/2的情況。這一發(fā)現(xiàn)表明,通過(guò)在系統(tǒng)提示中明確說(shuō)明游戲設(shè)置,可以有效減少先驗(yàn)知識(shí)對(duì)智能體行為的影響。

非零納什均衡的模擬實(shí)驗(yàn)

為了驗(yàn)證智能體在理解和推理方面的能力,研究團(tuán)隊(duì)設(shè)置了一個(gè)變體游戲,使納什均衡變?yōu)?0,而不是經(jīng)典游戲中的0。實(shí)驗(yàn)結(jié)果顯示,部分使用Qwen2-72B和MistralAI-8×22B的智能體能夠在第一輪中推理出新的納什均衡點(diǎn),并在隨后的游戲中逐漸接近10。

阿里巴巴與人民大學(xué)聯(lián)合團(tuán)隊(duì)的成果,AgentScope提升多智能體模擬效率-AI.x社區(qū)

圖14:當(dāng)我們?cè)谀M中將納什均衡改為 10 時(shí)報(bào)告的數(shù)字分布。

圖15:在 LLM 中使用不同溫度時(shí)報(bào)告的數(shù)字的分布。

這一發(fā)現(xiàn)表明,智能體在理解和推理方面表現(xiàn)出強(qiáng)大的能力,能夠根據(jù)新的游戲規(guī)則做出合理的決策。此外,實(shí)驗(yàn)還發(fā)現(xiàn),盡管智能體在推理過(guò)程中可能會(huì)犯一些簡(jiǎn)單的計(jì)算錯(cuò)誤,但這些錯(cuò)誤并不影響整體結(jié)論。

通過(guò)這些實(shí)驗(yàn),研究團(tuán)隊(duì)展示了AgentScope在大規(guī)模多智能體模擬中的強(qiáng)大能力和潛力。溫度對(duì)生成多樣性的影響、智能體扮演極端角色的表現(xiàn)、先驗(yàn)知識(shí)對(duì)智能體行為的影響以及非零納什均衡的模擬實(shí)驗(yàn),進(jìn)一步驗(yàn)證了AgentScope在支持復(fù)雜模擬和多樣化智能體行為方面的有效性。

結(jié)論

論文通過(guò)對(duì)AgentScope平臺(tái)的詳細(xì)解讀,展示了其在超大規(guī)模多智能體模擬中的最新改進(jìn)和實(shí)驗(yàn)結(jié)果。AgentScope通過(guò)引入基于actor模型的分布式機(jī)制、靈活的環(huán)境支持、易用的配置工具和自動(dòng)背景生成管道,顯著提升了大規(guī)模多智能體模擬的擴(kuò)展性、效率和多樣性。

實(shí)驗(yàn)結(jié)果表明,AgentScope不僅能夠支持大規(guī)模智能體模擬,還能夠通過(guò)詳細(xì)的行為指導(dǎo)和多輪游戲中的策略調(diào)整,促使智能體進(jìn)行更深入的思考和更理性的決策。此外,溫度對(duì)生成多樣性的影響、智能體扮演極端角色的表現(xiàn)、先驗(yàn)知識(shí)對(duì)智能體行為的影響以及非零納什均衡的模擬實(shí)驗(yàn),進(jìn)一步驗(yàn)證了AgentScope在支持復(fù)雜模擬和多樣化智能體行為方面的有效性。

未來(lái),AgentScope有望在更多領(lǐng)域中得到應(yīng)用,如交通管理、金融市場(chǎng)模擬、災(zāi)害應(yīng)急響應(yīng)和社會(huì)行為研究等。通過(guò)不斷優(yōu)化平臺(tái)性能和擴(kuò)展應(yīng)用場(chǎng)景,AgentScope將為研究人員和開(kāi)發(fā)者提供更強(qiáng)大的工具,支持他們?cè)诖笠?guī)模多智能體模擬領(lǐng)域進(jìn)行創(chuàng)新和探索。(END)

參考資料:https://arxiv.org/pdf/2407.17789

本文轉(zhuǎn)載自 ??大噬元獸??,作者: FlerkenS

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦