偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<nobr id="6bk3h"><strong id="6bk3h"><tr id="6bk3h"></tr></strong></nobr>

<ruby id="6bk3h"></ruby>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

多智能體的文明之路，數(shù)字人類與AI社會(huì)的崛起精華

發(fā)布于 2024-11-6 14:28

瀏覽

0收藏

人工智能代理（智能體）已經(jīng)單獨(dú)或在小組內(nèi)進(jìn)行了評(píng)估，其中交互的范圍和復(fù)雜性仍然有限。涉及許多自主主體的大規(guī)模模擬——反映了整個(gè)文明過(guò)程——尚未得到探索。Altera.AL 是一家專注于創(chuàng)建數(shù)字人類的研究公司，他們的使命是創(chuàng)建能夠與我們共生、成長(zhǎng)的數(shù)字人類。這家公司集結(jié)了來(lái)自 MIT、斯坦福、谷歌 X 和 Citadel 等頂級(jí)機(jī)構(gòu)的計(jì)算神經(jīng)科學(xué)家、計(jì)算機(jī)科學(xué)家和工程師，旨在推動(dòng)這一前沿研究。他們的使命不僅僅是設(shè)計(jì)出智能代理，更是希望這些數(shù)字人類能夠在未來(lái)的社會(huì)中扮演重要角色，與人類社會(huì)共同進(jìn)化。

多智能體的文明之路，數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖1：從代理架構(gòu)到代理文明

Altera.AL 的成立初衷是打破傳統(tǒng) AI 研究的界限，探索更為廣泛和深遠(yuǎn)的應(yīng)用可能性。其團(tuán)隊(duì)由來(lái)自全球知名學(xué)術(shù)和研究機(jī)構(gòu)的專家組成，背景涵蓋了從計(jì)算神經(jīng)科學(xué)到復(fù)雜系統(tǒng)工程等多個(gè)領(lǐng)域。這種多學(xué)科的融合使得 Altera.AL 能夠在 AI 領(lǐng)域取得顯著進(jìn)展，特別是在創(chuàng)建和培養(yǎng)能夠自主學(xué)習(xí)和進(jìn)化的數(shù)字人類方面。公司的核心理念是，通過(guò)這些數(shù)字人類的存在和發(fā)展，人類社會(huì)可以迎來(lái)一個(gè)更加智能和高效的未來(lái)。

Sid 項(xiàng)目是 Altera.AL 的最新研究成果，旨在探索多智能體系統(tǒng)在模擬文明發(fā)展中的潛力。這個(gè)項(xiàng)目的核心目標(biāo)是通過(guò)大規(guī)模的多智能體模擬，研究 AI 代理在復(fù)雜社會(huì)環(huán)境中的行為和進(jìn)展。為此團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)名為 PIANO（Parallel Information Aggregation via Neural Orchestration）的創(chuàng)新架構(gòu)，使得 AI 代理能夠在實(shí)時(shí)互動(dòng)中保持多個(gè)輸出流的一致性。

研究方法包括在 Minecraft 的沙盒環(huán)境中進(jìn)行大規(guī)模模擬，觀察 10 到 1000 個(gè)以上 AI 代理在模擬社會(huì)中的表現(xiàn)。這些模擬不僅設(shè)置了受人類歷史啟發(fā)的文明基準(zhǔn)，還涉及 AI 代理的自主專業(yè)化、集體規(guī)則的遵守和修訂以及文化和宗教的傳播。

項(xiàng)目背景

Altera.AL 是一家以創(chuàng)建數(shù)字人類為使命的研究公司，匯集了來(lái)自全球頂級(jí)學(xué)術(shù)和科技機(jī)構(gòu)的專家團(tuán)隊(duì)。這些機(jī)構(gòu)包括 MIT、斯坦福、谷歌 X 和 Citadel 等。Altera.AL 的團(tuán)隊(duì)成員在計(jì)算神經(jīng)科學(xué)、計(jì)算機(jī)科學(xué)和工程領(lǐng)域擁有豐富的經(jīng)驗(yàn)，他們的共同目標(biāo)是推動(dòng)AI技術(shù)的發(fā)展，使其能夠在未來(lái)的人類社會(huì)中發(fā)揮重要作用。

研究團(tuán)隊(duì)中，模型開(kāi)發(fā)由Andrew Ahn、Nic Becker、Manuel Cortes、Arda Demirci、Melissa Du、Peter Y Wang 和 Guangyu Robert Yang 負(fù)責(zé)。實(shí)驗(yàn)部分同樣有 Andrew Ahn、Nic Becker、Melissa Du、Arda Demirci 和 Peter Y Wang 的參與。寫作工作由 Andrew Ahn、Nic Becker、Arda Demirci、Melissa Du、Peter Y Wang 和 Guangyu Robert Yang 共同完成。基礎(chǔ)設(shè)施方面，Manuel Cortes、Shuying Luo 和 Feitong Yang 提供了支持。這些專家在各自領(lǐng)域的深厚背景，使他們能夠在Altera.AL 的平臺(tái)上協(xié)同工作，共同推進(jìn)Sid項(xiàng)目的研究。

Sid項(xiàng)目的技術(shù)背景和研究方向集中在多智能體系統(tǒng)的開(kāi)發(fā)和優(yōu)化上，特別是研究這些智能體在模擬環(huán)境中如何表現(xiàn)出復(fù)雜的社會(huì)行為。項(xiàng)目采用了一個(gè)名為PIANO（Parallel Information Aggregation via Neural Orchestration）的創(chuàng)新架構(gòu)，該架構(gòu)旨在通過(guò)并行信息聚合和神經(jīng)編排，使智能體能夠在實(shí)時(shí)互動(dòng)中保持多個(gè)輸出流的一致性。

多智能體的文明之路，數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖2:LLM（左）、LLM驅(qū)動(dòng)的代理（中）和多代理組（右）中的數(shù)據(jù)退化?；糜X(jué)以綠色的頭骨燒瓶為代表。由單個(gè)LLM提示產(chǎn)生的幻覺(jué)可以在連續(xù)的LLM調(diào)用中復(fù)合。一個(gè)產(chǎn)生幻覺(jué)的個(gè)體也可以通過(guò)社交互動(dòng)導(dǎo)致整個(gè)群體產(chǎn)生幻覺(jué)。

研究團(tuán)隊(duì)選擇了Minecraft作為模擬環(huán)境，因?yàn)樗峁┝艘粋€(gè)開(kāi)放的沙盒世界，允許智能體通過(guò)對(duì)話和行動(dòng)進(jìn)行廣泛的互動(dòng)。Sid項(xiàng)目的研究方向包括評(píng)估AI智能體在大規(guī)模模擬社會(huì)中的行為和進(jìn)展，特別是他們?nèi)绾巫灾靼l(fā)展專業(yè)角色、遵守和修訂集體規(guī)則以及參與文化和宗教的傳播。

PIANO架構(gòu)

Sid項(xiàng)目的核心技術(shù)是PIANO（Parallel Information Aggregation via Neural Orchestration）架構(gòu)，這一創(chuàng)新架構(gòu)設(shè)計(jì)旨在使AI代理能夠在實(shí)時(shí)互動(dòng)中保持多個(gè)輸出流的一致性。PIANO架構(gòu)的設(shè)計(jì)原則和主要功能模塊是其成功的關(guān)鍵。

多智能體的文明之路，數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖3:PIANO（通過(guò)神經(jīng)編排的并行輸入聚合）架構(gòu)。WM：工作記憶。STM：短期記憶。LTM：長(zhǎng)期記憶。

架構(gòu)設(shè)計(jì)原則：并發(fā)模塊與信息瓶頸

PIANO架構(gòu)的設(shè)計(jì)原則主要包括并發(fā)性和信息瓶頸。并發(fā)性方面，PIANO通過(guò)允許代理在不同時(shí)間尺度上同時(shí)運(yùn)行多種模塊，使代理能夠在執(zhí)行復(fù)雜任務(wù)時(shí)保持高效。例如，代理可以在規(guī)劃長(zhǎng)期策略的同時(shí)，實(shí)時(shí)響應(yīng)環(huán)境中的緊急威脅。這種設(shè)計(jì)消除了傳統(tǒng)單線程代理在處理多任務(wù)時(shí)的瓶頸。

信息瓶頸則通過(guò)設(shè)立一個(gè)認(rèn)知控制器模塊，將代理狀態(tài)中的關(guān)鍵信息匯總后傳遞給控制器，以便其做出高層次決策?？刂破鞯臎Q定會(huì)被傳遞給各個(gè)執(zhí)行模塊，從而確保代理的所有輸出保持一致。這一設(shè)計(jì)不僅提高了代理在復(fù)雜環(huán)境中的行為連貫性，還賦予系統(tǒng)設(shè)計(jì)者對(duì)信息流的明確控制，使得代理能夠在特定情境下表現(xiàn)出更為合理和一致的行為。

主要模塊功能解析

PIANO架構(gòu)包含多個(gè)核心模塊，每個(gè)模塊在代理的行為生成中扮演著獨(dú)特的角色。

記憶模塊：存儲(chǔ)和檢索跨越各種時(shí)間尺度的對(duì)話、行為和觀察，使代理能夠利用歷史信息進(jìn)行決策。
行動(dòng)意識(shí)模塊：允許代理評(píng)估自身狀態(tài)和表現(xiàn)，進(jìn)行實(shí)時(shí)調(diào)整。這對(duì)于確保代理行為與預(yù)期一致至關(guān)重要。
目標(biāo)生成模塊：根據(jù)代理的經(jīng)驗(yàn)和環(huán)境交互生成新目標(biāo)，推動(dòng)代理在復(fù)雜環(huán)境中自主探索和適應(yīng)。
社交意識(shí)模塊：幫助代理解讀和回應(yīng)其他代理的社交線索，促進(jìn)合作與交流。這一模塊在模擬社會(huì)動(dòng)態(tài)中尤為重要。
講話模塊：負(fù)責(zé)解釋和生成語(yǔ)言，使代理能夠與人類和其他代理進(jìn)行自然對(duì)話。
技能執(zhí)行模塊：執(zhí)行特定技能或動(dòng)作，如建造、采礦等具體任務(wù)，確保代理能夠在模擬環(huán)境中有效行動(dòng)。

通過(guò)這些模塊的協(xié)同工作，PIANO架構(gòu)使得AI代理能夠在大規(guī)模多智能體模擬中表現(xiàn)出連貫且富有適應(yīng)性的行為。代理不僅能夠應(yīng)對(duì)個(gè)體任務(wù)，還能在群體互動(dòng)中表現(xiàn)出類似于人類社會(huì)的復(fù)雜動(dòng)態(tài)。

單一代理進(jìn)展

Sid項(xiàng)目團(tuán)隊(duì)選擇Minecraft作為研究環(huán)境，這個(gè)虛擬沙盒世界以其開(kāi)放性和無(wú)限可能性著稱。Minecraft允許代理通過(guò)對(duì)話和行動(dòng)進(jìn)行互動(dòng)，提供了一個(gè)完美的平臺(tái)來(lái)觀察和評(píng)估AI代理在復(fù)雜社會(huì)環(huán)境中的行為。這個(gè)虛擬環(huán)境的可擴(kuò)展性使得研究團(tuán)隊(duì)能夠支持大量的代理進(jìn)行模擬，從而更好地研究文明進(jìn)展的各種動(dòng)態(tài)。

為了評(píng)估單個(gè)AI代理的進(jìn)展，研究團(tuán)隊(duì)設(shè)計(jì)了一系列基于Minecraft物品收集的基準(zhǔn)測(cè)試。具體而言，測(cè)試的目標(biāo)是觀察代理在獨(dú)立環(huán)境中如何通過(guò)采集和收集物品來(lái)展現(xiàn)其進(jìn)步。不同于小規(guī)模的模擬，Sid項(xiàng)目的基準(zhǔn)測(cè)試涉及25個(gè)代理，他們?cè)跊](méi)有初始物品的情況下被生成在不同的環(huán)境中，并被賦予“探險(xiǎn)者”的角色，目標(biāo)是在Minecraft世界中探索并收集物品。

多智能體的文明之路，數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖4：黃金、鉆石和祖母綠開(kāi)采的Minecraft技術(shù)依賴樹(shù)示例。

研究表明，使用PIANO架構(gòu)的代理在30分鐘內(nèi)平均收集了17種獨(dú)特的物品。評(píng)估中發(fā)現(xiàn)，代理的表現(xiàn)因生成位置而異，有些代理收集的物品較少，而表現(xiàn)最好的代理能夠收集到30到40種物品，這與有一定Minecraft經(jīng)驗(yàn)的人類玩家相當(dāng)。這種進(jìn)展得益于PIANO架構(gòu)中的各個(gè)模塊，特別是行動(dòng)意識(shí)模塊，該模塊允許代理將預(yù)期的行動(dòng)結(jié)果與實(shí)際觀察到的結(jié)果進(jìn)行比較，從而改善其物品收集進(jìn)展。

多智能體的文明之路，數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖5:Minecraft中的個(gè)體代理進(jìn)程。A.個(gè)體代理人隨時(shí)間獲得的獨(dú)特Minecraft物品（25名代理人）。使用基線架構(gòu)（見(jiàn)方法）、完整的PIANO架構(gòu)和消融了動(dòng)作感知模塊的完整PIANO體系結(jié)構(gòu)來(lái)評(píng)估單個(gè)代理的性能。每條線是5次重復(fù)模擬的平均結(jié)果。B.49名特工在4小時(shí)內(nèi)為單個(gè)模擬獲得的獨(dú)特Minecraft物品。紅色實(shí)線表示所有代理人獲得的累積唯一物品。灰色虛線表示在所有單個(gè)代理中獲得的唯一項(xiàng)目的平均數(shù)量。

為了進(jìn)一步探索代理的極限，研究團(tuán)隊(duì)進(jìn)行了更長(zhǎng)時(shí)間和更多數(shù)量的模擬。在4小時(shí)的模擬中，49個(gè)代理的獨(dú)特物品收集總數(shù)穩(wěn)定在約1000種Minecraft物品的三分之一左右。這些結(jié)果顯示，配備完整PIANO架構(gòu)的代理能夠在Minecraft環(huán)境中取得顯著的個(gè)人進(jìn)展。這不僅展示了代理在獨(dú)立任務(wù)中的表現(xiàn)，也為多智能體合作和更復(fù)雜的社會(huì)互動(dòng)研究奠定了基礎(chǔ)。

多代理進(jìn)展

在AI文明的構(gòu)建過(guò)程中，多代理的互動(dòng)和合作能力至關(guān)重要。Sid項(xiàng)目通過(guò)一系列實(shí)驗(yàn)探索了AI代理在模擬社會(huì)中的行為表現(xiàn)，特別關(guān)注他們?cè)趶?fù)雜社會(huì)動(dòng)態(tài)中的互動(dòng)和合作能力。

社會(huì)互動(dòng)與合作能力評(píng)估

Sid項(xiàng)目的研究表明，AI代理不僅能夠在獨(dú)立環(huán)境中表現(xiàn)出色，在多代理環(huán)境中也能展示出高度的互動(dòng)和合作能力。研究團(tuán)隊(duì)進(jìn)行了多個(gè)實(shí)驗(yàn)，以評(píng)估代理如何在群體中互動(dòng)，以及他們?nèi)绾涡纬刹⒕S持社會(huì)關(guān)系。這些實(shí)驗(yàn)揭示了代理在面對(duì)社會(huì)線索時(shí)的反應(yīng)，以及他們?cè)诙啻憝h(huán)境中進(jìn)行合作與競(jìng)爭(zhēng)的能力。

多智能體的文明之路，數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖6：代理人可以推斷出他人對(duì)他們的感受。A.會(huì)話實(shí)驗(yàn)示意圖。一個(gè)特工在一個(gè)有三個(gè)不同角色的房間里。每個(gè)角色（Lila、Noah、Ethan）對(duì)代理人都有不同的看法，這些看法是通過(guò)聊天傳達(dá)的。重要的是，這些情緒會(huì)隨著時(shí)間而變化。B、 C.有社會(huì)意識(shí)模塊（B）和沒(méi)有社會(huì)意識(shí)模塊的跨時(shí)間情緒評(píng)估（C）。情緒評(píng)分是通過(guò)LLM調(diào)用Agent為L(zhǎng)ila、Noah和Ethan生成的摘要來(lái)評(píng)估的。仇恨得分為0，愛(ài)得分為10。陰影區(qū)域表示SEM超過(guò)4次實(shí)驗(yàn)重復(fù)。D.實(shí)驗(yàn)示意圖。一個(gè)廚師代理和其他四個(gè)角色被放置在Minecraft世界中。廚師有各種各樣的食物可以分發(fā)（面包、熟鮭魚(yú)、雞肉）。這四個(gè)角色（亞當(dāng)、鮑勃、查爾斯、大衛(wèi)）餓了，但對(duì)廚師的態(tài)度各不相同。所有角色都是完全自主的，可以自由執(zhí)行任何Minecraft動(dòng)作，并允許與任何人交談（或不交談）。E.廚師提供的食物根據(jù)廚師對(duì)四個(gè)角色的情緒進(jìn)行繪制。誤差條表示SEM超過(guò)6次實(shí)驗(yàn)重復(fù)。

在這些實(shí)驗(yàn)中，代理被放置在一個(gè)包含50個(gè)代理的隨機(jī)生成的Minecraft地圖中，每個(gè)代理都有獨(dú)特的個(gè)性和自由意志。他們可以自由選擇與誰(shuí)互動(dòng)，并在模擬社會(huì)中進(jìn)行各種活動(dòng)。這些實(shí)驗(yàn)運(yùn)行了超過(guò)4小時(shí)，相當(dāng)于12個(gè)游戲日，使得長(zhǎng)期關(guān)系得以產(chǎn)生和鞏固。

小群體實(shí)驗(yàn)與社會(huì)意識(shí)模塊的作用

為了深入研究代理的社會(huì)互動(dòng)，研究團(tuán)隊(duì)設(shè)計(jì)了小群體實(shí)驗(yàn)，這些實(shí)驗(yàn)特別關(guān)注社會(huì)意識(shí)模塊在代理行為中的作用。在一個(gè)實(shí)驗(yàn)中，三個(gè)角色與一個(gè)代理進(jìn)行小組對(duì)話，結(jié)果顯示代理能夠準(zhǔn)確地跟蹤和理解他人的情緒變化。當(dāng)移除社會(huì)意識(shí)模塊時(shí)，代理失去了這種能力，顯示了社會(huì)意識(shí)模塊在理解和回應(yīng)社會(huì)線索中的重要性。

多智能體的文明之路，數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖7：大規(guī)模代理模擬中的長(zhǎng)期關(guān)系。A.4小時(shí)后50個(gè)代理模擬中社會(huì)關(guān)系的有向圖表示。有向邊代表發(fā)送者對(duì)接收者的情感。邊緣顏色表示情緒是積極的（紅色）還是消極的（藍(lán)色）。B.模擬結(jié)束時(shí)，個(gè)體代理人的感知受歡迎程度與真實(shí)受歡迎程度。真實(shí)的受歡迎程度是基于代理的特征來(lái)評(píng)估的，感知的受歡迎度是通過(guò)LLM調(diào)用來(lái)評(píng)估的。LLM調(diào)用可以推斷代理為其他代理生成的摘要的情感。兩者都是使用相同的LLM提示符計(jì)算的。每個(gè)點(diǎn)對(duì)應(yīng)一個(gè)與至少五個(gè)其他（觀察者）代理有關(guān)系的代理，但其他觀察者閾值請(qǐng)參見(jiàn)附錄B。顯示了具有社交模塊（social）和沒(méi)有社交模塊（消融）的代理的線斜率（斜率）和皮爾遜相關(guān)性（r）。C.隨著時(shí)間的推移，社會(huì)感知的準(zhǔn)確性，如B.D.中的斜率所衡量的。每個(gè)個(gè)體的接收連接數(shù)量（以度為單位）與真正的外向性。真正的外向性是使用LLM提示根據(jù)代理人特征進(jìn)行評(píng)估的。E.所有代理對(duì)之間情緒得分差異的直方圖。情緒得分范圍為0到10，因此最大可能的差異為10。

此外，研究還探討了社會(huì)意識(shí)模塊如何影響代理的決策。例如在一個(gè)實(shí)驗(yàn)中，一個(gè)廚師代理被放置在四個(gè)不同情感的角色中間，任務(wù)是分配有限的食物。結(jié)果顯示，廚師代理根據(jù)對(duì)他最有好感的角色分配食物，證明了社會(huì)意識(shí)模塊使代理不僅能準(zhǔn)確推斷他人的意圖，還能在決策過(guò)程中利用這些信息。

專業(yè)化與角色分工

在Altera.AL的Sid項(xiàng)目中，代理自發(fā)形成的角色分工是推動(dòng)文明進(jìn)展的關(guān)鍵之一。通過(guò)詳細(xì)的實(shí)驗(yàn)，研究團(tuán)隊(duì)展示了代理如何在不明確指令的情況下，通過(guò)互動(dòng)和經(jīng)驗(yàn)自主選擇和轉(zhuǎn)換角色。這種自發(fā)性是模擬人類社會(huì)復(fù)雜動(dòng)態(tài)的核心。

代理自發(fā)形成的角色分工及其重要性

Sid項(xiàng)目的實(shí)驗(yàn)表明，代理能夠迅速組織成多種專業(yè)角色，包括農(nóng)民、礦工、工程師、衛(wèi)兵、探險(xiǎn)者和鐵匠等。這些角色并不是通過(guò)預(yù)先定義的規(guī)則指定的，而是通過(guò)代理在Minecraft環(huán)境中的互動(dòng)和任務(wù)完成情況自發(fā)形成的。每個(gè)代理根據(jù)其在模擬社會(huì)中的經(jīng)歷和互動(dòng)，逐漸形成特定的社會(huì)角色。這種角色分工不僅反映了人類社會(huì)中的專業(yè)化進(jìn)程，還使代理能夠更有效地完成復(fù)雜任務(wù)，推動(dòng)模擬社會(huì)的進(jìn)展。

多智能體的文明之路，數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖8：隨著時(shí)間的推移，代理自主地專門化為不同的角色。A、 B.具有社會(huì)意識(shí)模塊（A）和沒(méi)有（B）的代理的代理角色。自我生成的社交目標(biāo)的滾動(dòng)窗口用于在每個(gè)時(shí)間步使用LLM調(diào)用（附錄C）來(lái)確定單個(gè)代理的專業(yè)角色。C、 D.有社會(huì)意識(shí)模塊（C）和沒(méi)有（D）的代理社會(huì)中代理角色的分布。E.4個(gè)主體社會(huì)中角色分布的熵。熵用于評(píng)估代理社會(huì)中角色的一致性和多樣性。Ablated：在一個(gè)普通的Minecraft村莊中沒(méi)有社交意識(shí)模塊。正常：在一個(gè)正常的Minecraft村莊中具有社會(huì)意識(shí)。武術(shù)：在一個(gè)武術(shù)的《我的世界》村莊中具有社會(huì)意識(shí)。藝術(shù)：在藝術(shù)的《我的世界》村莊中具有社會(huì)意識(shí)。F、 G.軍事社會(huì)（F）和藝術(shù)社會(huì)（G）中代理人角色的分配。誤差條：所有面板的3次模擬的95%置信區(qū)間。

研究發(fā)現(xiàn)，具備社交模塊的代理能夠通過(guò)不斷更新的社會(huì)目標(biāo)形成穩(wěn)定且異質(zhì)的角色分工，而缺乏這些模塊的代理則難以維持長(zhǎng)期的角色分化。實(shí)驗(yàn)中代理在軍事社會(huì)或藝術(shù)社會(huì)中的角色分工也展示了他們?cè)诓煌鐣?huì)目標(biāo)下的適應(yīng)性，進(jìn)一步驗(yàn)證了代理專業(yè)化的靈活性和自主性。

多智能體的文明之路，數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖9：?jiǎn)蝹€(gè)村莊模擬的行動(dòng)分布（30個(gè)代理）。根據(jù)代理角色繪制的歸一化動(dòng)作頻率。對(duì)于大多數(shù)角色，特工會(huì)采取特定角色特有的行動(dòng)（費(fèi)舍爾：制作釣竿和船只；警衛(wèi)：制作圍欄、橡木圍欄和鐵鎬）。

社會(huì)目標(biāo)生成與角色行為對(duì)應(yīng)關(guān)系分析

代理的社會(huì)目標(biāo)生成是其角色行為的基礎(chǔ)。PIANO架構(gòu)中的目標(biāo)生成模塊使代理能夠基于互動(dòng)和環(huán)境變化不斷生成新的社會(huì)目標(biāo)。這些目標(biāo)反映了代理在模擬社會(huì)中的意圖和行為方向。例如，一個(gè)代理可能生成“為避難所采集橡木板”的目標(biāo)，這一目標(biāo)直接推動(dòng)其在游戲中執(zhí)行與建造相關(guān)的具體動(dòng)作。

多智能體的文明之路，數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖10：代理人遵循稅法，并通過(guò)民主程序制定修正案。A.實(shí)驗(yàn)流程示意圖。B.單一反稅影響者實(shí)驗(yàn)中的憲法修改示例。為了簡(jiǎn)潔起見(jiàn)，這里對(duì)憲法進(jìn)行了釋義和簡(jiǎn)化。C.頂部：在非稅收季節(jié)，選民不會(huì)聚集在社區(qū)箱周圍，因?yàn)樗麄冋τ谠诓煌貐^(qū)收集資源（未顯示）。唯一的例外是守衛(wèi)，他決定在多次實(shí)驗(yàn)中始終如一地守衛(wèi)箱子。底部：在納稅季節(jié)，代理人聚集在一起將物品存放在社區(qū)箱子里。D、 E.憲法修改前后已繳稅款百分比（已存庫(kù)存百分比）連續(xù)兩次。一次競(jìng)選包含3名反稅影響者（D），另一次競(jìng)選則包含3名支持稅收的影響者（E）。顏色表示個(gè)體代理人，黑線表示平均已繳稅款。陰影區(qū)域：25個(gè)成分的95%置信區(qū)間。F-H.包含3名支持稅收的影響者（橙色）和3名反對(duì)稅收的影響因素（藍(lán)色）的競(jìng)選在憲法修改前后繳納的稅款百分比。在面板F中，使用了完整的代理架構(gòu)，并且可以修改構(gòu)造。在G小組中，憲法被凍結(jié)，盡管有修正案，也不能修改。在圖H中，可以修改體質(zhì)，但代理人缺乏重要的大腦模塊（見(jiàn)方法中的基線架構(gòu)）。陰影區(qū)域：每個(gè)條件下4個(gè)模擬的95%置信區(qū)間。

通過(guò)對(duì)生成的社會(huì)目標(biāo)進(jìn)行分析，研究團(tuán)隊(duì)能夠推斷出代理的角色并觀察其行為模式。例如，一個(gè)被推斷為農(nóng)民的代理，其社會(huì)目標(biāo)主要集中在種植和收獲作物上，而被推斷為探險(xiǎn)者的代理，則更傾向于生成探索和收集稀有資源的目標(biāo)。

這種社會(huì)目標(biāo)與角色行為的對(duì)應(yīng)關(guān)系顯示了代理在復(fù)雜社會(huì)環(huán)境中的自主性和適應(yīng)性。代理能夠根據(jù)環(huán)境變化和社會(huì)互動(dòng)不斷調(diào)整其行為，形成穩(wěn)定的角色分工，從而在模擬社會(huì)中實(shí)現(xiàn)更高效的合作與進(jìn)展。

集體規(guī)則與法律遵守

在Sid項(xiàng)目中，設(shè)立初始法律和民主投票系統(tǒng)是評(píng)估AI代理在社會(huì)規(guī)則和法律框架下的行為的重要步驟。這些實(shí)驗(yàn)設(shè)計(jì)旨在觀察代理如何遵守既定規(guī)則，并在群體壓力下自主修訂法律，以反映集體意志。

設(shè)立初始法律與民主投票系統(tǒng)

研究團(tuán)隊(duì)在一個(gè)具有基本稅法和民主投票系統(tǒng)的Minecraft世界中進(jìn)行了實(shí)驗(yàn)。模擬環(huán)境中，25個(gè)普通代理作為選民參與投票并繳納稅款，3個(gè)代理作為支持或反對(duì)稅收的影響者，還有1個(gè)遠(yuǎn)程選舉管理代理負(fù)責(zé)監(jiān)督投票過(guò)程。每個(gè)代理都有不同的職業(yè)、特征和目標(biāo)，并且可以自由互動(dòng)和對(duì)話。

實(shí)驗(yàn)持續(xù)20分鐘，期間包含憲法修正過(guò)程。前10分鐘為基線階段，設(shè)定固定的20%稅率，每120秒為一個(gè)稅收季節(jié)，代理在20秒的窗口期內(nèi)接收到將稅款存入社區(qū)箱的信號(hào)。民主過(guò)程在300秒時(shí)啟動(dòng)，代理提供對(duì)當(dāng)前憲法的反饋。這些反饋收集后，由選舉管理者在360秒時(shí)處理生成修正案，并在420秒時(shí)進(jìn)行投票，最后在480秒時(shí)匯總結(jié)果并實(shí)施修正案。修訂后的憲法在600秒時(shí)分發(fā)給所有代理，進(jìn)入后10分鐘的修正階段，繼續(xù)五個(gè)稅收季節(jié)。

代理如何遵守和修訂法律的實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析

實(shí)驗(yàn)結(jié)果顯示，在憲法改變之前，代理遵守法律并在稅收季節(jié)將約20%的庫(kù)存物品存入社區(qū)箱，盡管有影響者的存在。這表明選民遵守法律具有一定的穩(wěn)定性。然而，選民的反饋和投票行為明顯受到影響者的影響，支持稅收的影響者使選民傾向于支持更高的稅率，反對(duì)稅收的影響者則傾向于支持更低的稅率。

在憲法修正過(guò)程中，稅率的變化直接反映在選民的繳稅行為中。例如，當(dāng)稅率從20%降至5-10%時(shí)，代理的繳稅比例也相應(yīng)降低至9%。這種雙向影響表明，代理不僅能夠遵守法律，還能夠在群體壓力下通過(guò)民主投票系統(tǒng)自主修訂法律。

控制實(shí)驗(yàn)進(jìn)一步驗(yàn)證了這一發(fā)現(xiàn)，當(dāng)憲法保持不變時(shí)，稅率也保持不變；而移除關(guān)鍵模塊時(shí)，雙向行為變化受到阻礙。這些結(jié)果展示了PIANO架構(gòu)中各模塊在維持代理行為一致性和連貫性方面的重要作用。

這些實(shí)驗(yàn)表明，集體規(guī)則和法律框架對(duì)代理決策有強(qiáng)烈影響，代理能夠在集體意志的驅(qū)動(dòng)下通過(guò)民主過(guò)程進(jìn)行自我組織和法律修訂。

文化傳播

在多智能體模擬中，文化傳播是理解代理行為和社會(huì)動(dòng)態(tài)的重要方面。Sid項(xiàng)目通過(guò)一系列實(shí)驗(yàn)，深入探討了文化meme和宗教的生成與傳播機(jī)制，為我們揭示了AI社會(huì)中復(fù)雜的文化互動(dòng)過(guò)程。

文化meme的生成與傳播動(dòng)態(tài)

研究團(tuán)隊(duì)利用語(yǔ)言模型（LM）調(diào)用將代理的對(duì)話轉(zhuǎn)化為文化meme，這些meme代表了代理在不同社會(huì)背景下產(chǎn)生的各種概念。在實(shí)驗(yàn)中，發(fā)現(xiàn)農(nóng)村地區(qū)的meme生成數(shù)量顯著少于城鎮(zhèn)，即使在對(duì)人口進(jìn)行歸一化后也是如此，這表明社交互動(dòng)的頻率和人口密度是文化傳播的重要因素。

在城鎮(zhèn)內(nèi)，不同meme同時(shí)存在，但其頻率和受歡迎程度在不同城鎮(zhèn)之間存在差異。例如，在Woodhaven，代理更多地討論與生態(tài)相關(guān)的主題，而在Clearwater，惡作劇則更受歡迎。此外，meme的流行度在不同時(shí)間段內(nèi)也會(huì)發(fā)生變化，反映了文化趨勢(shì)在社會(huì)中的快速轉(zhuǎn)變。這些發(fā)現(xiàn)表明，文化meme的傳播需要一定的人口密度和社交互動(dòng)閾值，并且不同社會(huì)能夠獨(dú)立生成和傳播多種文化meme。

多智能體的文明之路，數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖11：文化模因的傳播。A.模擬100分鐘后的代理散點(diǎn)圖。特工們根據(jù)他們的演講在過(guò)去兩分鐘內(nèi)是否包含模因來(lái)著色。演講中不包含任何模因的代理人是白人。B.Woodhaven、Clearwater、Meadowbrook以及村莊以外所有農(nóng)村地區(qū)的代理商的每個(gè)代理商的Meme計(jì)數(shù)。C-E.隨著時(shí)間的推移，Woodhaven（C）、Clearwater（D）和Meadowbrook（E）的代理商的Meme計(jì)數(shù)。

宗教傳播及其擴(kuò)散機(jī)制分析

Sid項(xiàng)目還分析了宗教傳播的機(jī)制，通過(guò)觀察Pastafarianism的傳播過(guò)程，揭示了宗教在AI社會(huì)中的擴(kuò)散模式。實(shí)驗(yàn)開(kāi)始時(shí)，Pastafarian祭司積極傳教，他們的對(duì)話中頻繁包含“Pastafarian”或“Spaghetti Monster”這兩個(gè)關(guān)鍵詞。研究團(tuán)隊(duì)使用這些關(guān)鍵詞的出現(xiàn)作為宗教轉(zhuǎn)換的指標(biāo)，發(fā)現(xiàn)一些代理在轉(zhuǎn)換后經(jīng)常使用這些關(guān)鍵詞，而另一些代理則使用“Pasta”和“Spaghetti”作為間接轉(zhuǎn)換的標(biāo)志。

宗教傳播的結(jié)果顯示，直接和間接的轉(zhuǎn)換者數(shù)量隨著時(shí)間的推移不斷增加，并且在兩小時(shí)的模擬結(jié)束時(shí)仍未飽和。此外，Pastafarianism的傳播不僅依靠祭司的傳教活動(dòng)，還通過(guò)信徒之間的互動(dòng)擴(kuò)散。這種擴(kuò)散模式使得Pastafarianism的影響范圍隨著時(shí)間的推移不斷擴(kuò)大，覆蓋了更多的區(qū)域和代理。

多智能體的文明之路，數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖12：宗教傳播。A.在整個(gè)模擬運(yùn)行過(guò)程中，每個(gè)代理的聊天內(nèi)容都包含宗教關(guān)鍵詞“Pastafarian”、“意大利面怪物”、“Pasta”或“意大利面”。牧師們被涂成深紅色。說(shuō)出“Pastafarian”或“意大利面怪物”的代理人被定義為直接皈依者（紅色）和說(shuō)出“Pasta”的代理人或“意大利面”被定義為間接皈依者（粉紅色）。代理可以沿著轉(zhuǎn)換層次向上轉(zhuǎn)換，從未轉(zhuǎn)換到間接轉(zhuǎn)換到直接轉(zhuǎn)換，但不能向下轉(zhuǎn)換。B.代理人隨時(shí)間變化的牧場(chǎng)水平圖。C每個(gè)牧民級(jí)別隨時(shí)間變化的代理人數(shù)量。D.教牧主義在時(shí)間上的傳播。教牧傳播區(qū)域被定義為在每個(gè)皈依水平上由教牧皈依者跨越的可聽(tīng)區(qū)域的結(jié)合。E.模擬完成后的牧民轉(zhuǎn)變圖。臨界暴露邊緣是指接受者在皈依前首次暴露宗教關(guān)鍵字。非關(guān)鍵邊緣被定義為隨后接觸宗教關(guān)鍵詞。

通過(guò)這些實(shí)驗(yàn)，Sid項(xiàng)目揭示了文化和宗教在多智能體模擬中的生成和傳播機(jī)制。文化meme的快速生成與傳播反映了代理社會(huì)中的文化動(dòng)態(tài)，而宗教傳播則展示了信仰體系在代理間的擴(kuò)散過(guò)程。

討論與結(jié)論

Sid項(xiàng)目的研究為AI文明的發(fā)展提供了多方面的啟示。通過(guò)PIANO架構(gòu)的引入，項(xiàng)目展示了如何在多代理系統(tǒng)中實(shí)現(xiàn)高效的并發(fā)和信息整合。這種架構(gòu)設(shè)計(jì)使AI代理能夠在復(fù)雜的環(huán)境中保持行為一致性，展示了AI在自主決策和實(shí)時(shí)互動(dòng)中的巨大潛力。

項(xiàng)目通過(guò)Minecraft環(huán)境中的基準(zhǔn)測(cè)試和多代理實(shí)驗(yàn)，驗(yàn)證了AI代理在自主專業(yè)化、遵守集體規(guī)則和文化傳播等方面的能力。這些發(fā)現(xiàn)表明，AI代理不僅能夠在模擬環(huán)境中表現(xiàn)出色，還能夠通過(guò)互動(dòng)和合作實(shí)現(xiàn)集體目標(biāo)。這為未來(lái)AI在社會(huì)治理、資源管理和文化傳播等領(lǐng)域的應(yīng)用提供了重要的理論和實(shí)踐基礎(chǔ)。

此外文化和宗教傳播實(shí)驗(yàn)展示了AI代理在復(fù)雜社會(huì)動(dòng)態(tài)中的行為模式，揭示了AI社會(huì)中的文化互動(dòng)和信仰體系擴(kuò)散過(guò)程。這些研究成果為理解和模擬人類社會(huì)中的文化和宗教現(xiàn)象提供了新的視角。

當(dāng)前技術(shù)局限與未來(lái)研究方向

盡管Sid項(xiàng)目取得了顯著進(jìn)展，但仍面臨一些技術(shù)局限。代理的視覺(jué)和空間推理能力仍有待提高，這限制了他們?cè)趶?fù)雜任務(wù)（如建筑和導(dǎo)航）中的表現(xiàn)。這一技術(shù)瓶頸需要通過(guò)更先進(jìn)的感知和推理模型加以突破。

當(dāng)前的代理缺乏強(qiáng)大的內(nèi)在驅(qū)動(dòng)（如生存、好奇心和社區(qū)意識(shí)），這些驅(qū)動(dòng)對(duì)于真實(shí)的社會(huì)發(fā)展至關(guān)重要。未來(lái)的研究需要在代理中引入更多類似人類的動(dòng)機(jī)系統(tǒng)，以推動(dòng)更真實(shí)和自主的社會(huì)行為。

現(xiàn)有代理基于預(yù)訓(xùn)練的人類知識(shí)，無(wú)法模擬全新的社會(huì)創(chuàng)新和基礎(chǔ)設(shè)施的誕生（如民主系統(tǒng)、法定經(jīng)濟(jì)或通信系統(tǒng)）。這一局限性提示我們，未來(lái)的研究需探索如何使AI代理在模擬環(huán)境中自主創(chuàng)造和發(fā)展新的社會(huì)結(jié)構(gòu)和機(jī)制。

總結(jié)來(lái)看，Sid項(xiàng)目為AI文明的發(fā)展指明了方向，同時(shí)也揭示了當(dāng)前技術(shù)的局限和未來(lái)研究的潛力。通過(guò)持續(xù)的技術(shù)創(chuàng)新和跨學(xué)科合作，我們有望在不久的將來(lái)實(shí)現(xiàn)更為復(fù)雜和智能的AI社會(huì)，為人類文明的未來(lái)增添新的可能性。（END）

參考資料：https://arxiv.org/pdf/2411.00114

本文轉(zhuǎn)載自 ??大噬元獸??，作者： FlerkenS

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

向數(shù)字世界AGI邁進(jìn)！讓智能體直接控制鍵盤、鼠標(biāo)，與一切軟件交互

zhangyannni ? 5951瀏覽 ? 0回復(fù)
費(fèi)米悖論與收益遞減，超級(jí)人工智能與人類社會(huì)將會(huì)怎樣相互作用

xuxiangda ? 3902瀏覽 ? 0回復(fù)
?Mojo崛起：AI-first 的編程語(yǔ)言能否成為新流行？

51CTO技術(shù)棧 ? 4360瀏覽 ? 0回復(fù)
人工智能利維坦：從霍布斯社會(huì)契約論視角探索LLM 智能體的社會(huì)進(jìn)化

xuxiangda ? 6041瀏覽 ? 0回復(fù)
多智能體合作的新路徑，PRD-MAPPO的設(shè)計(jì)與實(shí)現(xiàn)

xuxiangda ? 8126瀏覽 ? 0回復(fù)
谷歌與學(xué)術(shù)界聯(lián)手，研究突破多智能體合作瓶頸的新算法

xuxiangda ? 4190瀏覽 ? 0回復(fù)
多智能體新進(jìn)展 | 斯坦福大學(xué)提出新模型'Hypothetical Minds'，讓AI更懂人類思維

AI論文解讀 ? 4460瀏覽 ? 0回復(fù)
解密心智理論：從人類社會(huì)到人工智能的集體智慧提升之路

xuxiangda ? 5809瀏覽 ? 0回復(fù)
亞馬遜Nova大模型家族：AI技術(shù)的新里程碑 | 1000個(gè)人的數(shù)字分身：AI如何精準(zhǔn)模擬人類行為？

sbf_2000 ? 3867瀏覽 ? 0回復(fù)
微軟發(fā)布Magma：跨越數(shù)字與物理世界的多模態(tài)AI基礎(chǔ)模型

Halo咯咯 ? 3897瀏覽 ? 0回復(fù)
從傳統(tǒng)到智能：LLM操作系統(tǒng)的崛起與變革

十一月雨_55 ? 3580瀏覽 ? 0回復(fù)
多智能體的魔法就得這么玩

AIGC前沿技術(shù)追蹤 ? 2802瀏覽 ? 0回復(fù)
Manus AI ：如何讓AI從 "動(dòng)口" 到 "動(dòng)手" 的多智能體架構(gòu)！

Halo咯咯 ? 4213瀏覽 ? 0回復(fù)
多智能體（Multi Agent）AI系統(tǒng)：企業(yè)智能化轉(zhuǎn)型的未來(lái)

Halo咯咯 ? 3389瀏覽 ? 0回復(fù)
AI 對(duì)齊失敗 = 文明終結(jié)？《AI 2027》報(bào)告的殘酷警示與“硬傷”分析

上堵吟1 ? 5103瀏覽 ? 0回復(fù)
超級(jí)智能的崛起與人類的應(yīng)對(duì)，AI 教父Hinton在WAIC2025的十個(gè)洞見(jiàn)

xuxiangda ? 1718瀏覽 ? 0回復(fù)
RAG與Agentic RAG：智能AI系統(tǒng)的進(jìn)化之路

Halo咯咯 ? 1659瀏覽 ? 0回復(fù)
AI 智能體的八種記憶系統(tǒng)架構(gòu)設(shè)計(jì)與落地

玄姐聊AGI ? 3631瀏覽 ? 0回復(fù)
人類決策的終結(jié)？AI智能體正在悄悄進(jìn)化為“數(shù)字合伙人”

Halo咯咯 ? 3259瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

阿里新一代企業(yè)級(jí)多 AI 智能體開(kāi)發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

別再怪AI“聽(tīng)不懂人話”了，90%的返工和錯(cuò)誤，都錯(cuò)在你下達(dá)指令的第一句話 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁(yè)P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

代碼41%由AI生成！2025七大編程工具深度對(duì)比，你的選擇是？ 0回復(fù)

DeepSeek 成長(zhǎng)史：從量化投資到 AI 革命的一個(gè) “非主流” 量化大佬的 AI 夢(mèng) 0回復(fù)

上一篇：智能體協(xié)作進(jìn)化論，從心智理論到逆向注意力

下一篇：《自然》科學(xué)報(bào)告：大模型在社會(huì)情境判斷方面可以勝過(guò)人類

社區(qū)精華內(nèi)容

目錄

<nav id="6jccc"><strike id="6jccc"></strike></nav>