偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

多智能體的文明之路,數(shù)字人類與AI社會(huì)的崛起 精華

發(fā)布于 2024-11-6 14:28
瀏覽
0收藏

人工智能代理(智能體)已經(jīng)單獨(dú)或在小組內(nèi)進(jìn)行了評(píng)估,其中交互的范圍和復(fù)雜性仍然有限。涉及許多自主主體的大規(guī)模模擬——反映了整個(gè)文明過(guò)程——尚未得到探索。Altera.AL 是一家專注于創(chuàng)建數(shù)字人類的研究公司,他們的使命是創(chuàng)建能夠與我們共生、成長(zhǎng)的數(shù)字人類。這家公司集結(jié)了來(lái)自 MIT、斯坦福、谷歌 X 和 Citadel 等頂級(jí)機(jī)構(gòu)的計(jì)算神經(jīng)科學(xué)家、計(jì)算機(jī)科學(xué)家和工程師,旨在推動(dòng)這一前沿研究。他們的使命不僅僅是設(shè)計(jì)出智能代理,更是希望這些數(shù)字人類能夠在未來(lái)的社會(huì)中扮演重要角色,與人類社會(huì)共同進(jìn)化。

多智能體的文明之路,數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖1:從代理架構(gòu)到代理文明

Altera.AL 的成立初衷是打破傳統(tǒng) AI 研究的界限,探索更為廣泛和深遠(yuǎn)的應(yīng)用可能性。其團(tuán)隊(duì)由來(lái)自全球知名學(xué)術(shù)和研究機(jī)構(gòu)的專家組成,背景涵蓋了從計(jì)算神經(jīng)科學(xué)到復(fù)雜系統(tǒng)工程等多個(gè)領(lǐng)域。這種多學(xué)科的融合使得 Altera.AL 能夠在 AI 領(lǐng)域取得顯著進(jìn)展,特別是在創(chuàng)建和培養(yǎng)能夠自主學(xué)習(xí)和進(jìn)化的數(shù)字人類方面。公司的核心理念是,通過(guò)這些數(shù)字人類的存在和發(fā)展,人類社會(huì)可以迎來(lái)一個(gè)更加智能和高效的未來(lái)。

Sid 項(xiàng)目是 Altera.AL 的最新研究成果,旨在探索多智能體系統(tǒng)在模擬文明發(fā)展中的潛力。這個(gè)項(xiàng)目的核心目標(biāo)是通過(guò)大規(guī)模的多智能體模擬,研究 AI 代理在復(fù)雜社會(huì)環(huán)境中的行為和進(jìn)展。為此團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)名為 PIANO(Parallel Information Aggregation via Neural Orchestration)的創(chuàng)新架構(gòu),使得 AI 代理能夠在實(shí)時(shí)互動(dòng)中保持多個(gè)輸出流的一致性。

研究方法包括在 Minecraft 的沙盒環(huán)境中進(jìn)行大規(guī)模模擬,觀察 10 到 1000 個(gè)以上 AI 代理在模擬社會(huì)中的表現(xiàn)。這些模擬不僅設(shè)置了受人類歷史啟發(fā)的文明基準(zhǔn),還涉及 AI 代理的自主專業(yè)化、集體規(guī)則的遵守和修訂以及文化和宗教的傳播。

項(xiàng)目背景

Altera.AL 是一家以創(chuàng)建數(shù)字人類為使命的研究公司,匯集了來(lái)自全球頂級(jí)學(xué)術(shù)和科技機(jī)構(gòu)的專家團(tuán)隊(duì)。這些機(jī)構(gòu)包括 MIT、斯坦福、谷歌 X 和 Citadel 等。Altera.AL 的團(tuán)隊(duì)成員在計(jì)算神經(jīng)科學(xué)、計(jì)算機(jī)科學(xué)和工程領(lǐng)域擁有豐富的經(jīng)驗(yàn),他們的共同目標(biāo)是推動(dòng)AI技術(shù)的發(fā)展,使其能夠在未來(lái)的人類社會(huì)中發(fā)揮重要作用。

研究團(tuán)隊(duì)中,模型開(kāi)發(fā)由Andrew Ahn、Nic Becker、Manuel Cortes、Arda Demirci、Melissa Du、Peter Y Wang 和 Guangyu Robert Yang 負(fù)責(zé)。實(shí)驗(yàn)部分同樣有 Andrew Ahn、Nic Becker、Melissa Du、Arda Demirci 和 Peter Y Wang 的參與。寫作工作由 Andrew Ahn、Nic Becker、Arda Demirci、Melissa Du、Peter Y Wang 和 Guangyu Robert Yang 共同完成。基礎(chǔ)設(shè)施方面,Manuel Cortes、Shuying Luo 和 Feitong Yang 提供了支持。這些專家在各自領(lǐng)域的深厚背景,使他們能夠在Altera.AL 的平臺(tái)上協(xié)同工作,共同推進(jìn)Sid項(xiàng)目的研究。

Sid項(xiàng)目的技術(shù)背景和研究方向集中在多智能體系統(tǒng)的開(kāi)發(fā)和優(yōu)化上,特別是研究這些智能體在模擬環(huán)境中如何表現(xiàn)出復(fù)雜的社會(huì)行為。項(xiàng)目采用了一個(gè)名為PIANO(Parallel Information Aggregation via Neural Orchestration)的創(chuàng)新架構(gòu),該架構(gòu)旨在通過(guò)并行信息聚合和神經(jīng)編排,使智能體能夠在實(shí)時(shí)互動(dòng)中保持多個(gè)輸出流的一致性。

多智能體的文明之路,數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖2:LLM(左)、LLM驅(qū)動(dòng)的代理(中)和多代理組(右)中的數(shù)據(jù)退化?;糜X(jué)以綠色的頭骨燒瓶為代表。由單個(gè)LLM提示產(chǎn)生的幻覺(jué)可以在連續(xù)的LLM調(diào)用中復(fù)合。一個(gè)產(chǎn)生幻覺(jué)的個(gè)體也可以通過(guò)社交互動(dòng)導(dǎo)致整個(gè)群體產(chǎn)生幻覺(jué)。

研究團(tuán)隊(duì)選擇了Minecraft作為模擬環(huán)境,因?yàn)樗峁┝艘粋€(gè)開(kāi)放的沙盒世界,允許智能體通過(guò)對(duì)話和行動(dòng)進(jìn)行廣泛的互動(dòng)。Sid項(xiàng)目的研究方向包括評(píng)估AI智能體在大規(guī)模模擬社會(huì)中的行為和進(jìn)展,特別是他們?nèi)绾巫灾靼l(fā)展專業(yè)角色、遵守和修訂集體規(guī)則以及參與文化和宗教的傳播。

PIANO架構(gòu)

Sid項(xiàng)目的核心技術(shù)是PIANO(Parallel Information Aggregation via Neural Orchestration)架構(gòu),這一創(chuàng)新架構(gòu)設(shè)計(jì)旨在使AI代理能夠在實(shí)時(shí)互動(dòng)中保持多個(gè)輸出流的一致性。PIANO架構(gòu)的設(shè)計(jì)原則和主要功能模塊是其成功的關(guān)鍵。

多智能體的文明之路,數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖3:PIANO(通過(guò)神經(jīng)編排的并行輸入聚合)架構(gòu)。WM:工作記憶。STM:短期記憶。LTM:長(zhǎng)期記憶。

架構(gòu)設(shè)計(jì)原則:并發(fā)模塊與信息瓶頸

PIANO架構(gòu)的設(shè)計(jì)原則主要包括并發(fā)性和信息瓶頸。并發(fā)性方面,PIANO通過(guò)允許代理在不同時(shí)間尺度上同時(shí)運(yùn)行多種模塊,使代理能夠在執(zhí)行復(fù)雜任務(wù)時(shí)保持高效。例如,代理可以在規(guī)劃長(zhǎng)期策略的同時(shí),實(shí)時(shí)響應(yīng)環(huán)境中的緊急威脅。這種設(shè)計(jì)消除了傳統(tǒng)單線程代理在處理多任務(wù)時(shí)的瓶頸。

信息瓶頸則通過(guò)設(shè)立一個(gè)認(rèn)知控制器模塊,將代理狀態(tài)中的關(guān)鍵信息匯總后傳遞給控制器,以便其做出高層次決策??刂破鞯臎Q定會(huì)被傳遞給各個(gè)執(zhí)行模塊,從而確保代理的所有輸出保持一致。這一設(shè)計(jì)不僅提高了代理在復(fù)雜環(huán)境中的行為連貫性,還賦予系統(tǒng)設(shè)計(jì)者對(duì)信息流的明確控制,使得代理能夠在特定情境下表現(xiàn)出更為合理和一致的行為。

主要模塊功能解析

PIANO架構(gòu)包含多個(gè)核心模塊,每個(gè)模塊在代理的行為生成中扮演著獨(dú)特的角色。

  • 記憶模塊:存儲(chǔ)和檢索跨越各種時(shí)間尺度的對(duì)話、行為和觀察,使代理能夠利用歷史信息進(jìn)行決策。
  • 行動(dòng)意識(shí)模塊:允許代理評(píng)估自身狀態(tài)和表現(xiàn),進(jìn)行實(shí)時(shí)調(diào)整。這對(duì)于確保代理行為與預(yù)期一致至關(guān)重要。
  • 目標(biāo)生成模塊:根據(jù)代理的經(jīng)驗(yàn)和環(huán)境交互生成新目標(biāo),推動(dòng)代理在復(fù)雜環(huán)境中自主探索和適應(yīng)。
  • 社交意識(shí)模塊:幫助代理解讀和回應(yīng)其他代理的社交線索,促進(jìn)合作與交流。這一模塊在模擬社會(huì)動(dòng)態(tài)中尤為重要。
  • 講話模塊:負(fù)責(zé)解釋和生成語(yǔ)言,使代理能夠與人類和其他代理進(jìn)行自然對(duì)話。
  • 技能執(zhí)行模塊:執(zhí)行特定技能或動(dòng)作,如建造、采礦等具體任務(wù),確保代理能夠在模擬環(huán)境中有效行動(dòng)。

通過(guò)這些模塊的協(xié)同工作,PIANO架構(gòu)使得AI代理能夠在大規(guī)模多智能體模擬中表現(xiàn)出連貫且富有適應(yīng)性的行為。代理不僅能夠應(yīng)對(duì)個(gè)體任務(wù),還能在群體互動(dòng)中表現(xiàn)出類似于人類社會(huì)的復(fù)雜動(dòng)態(tài)。

單一代理進(jìn)展

Sid項(xiàng)目團(tuán)隊(duì)選擇Minecraft作為研究環(huán)境,這個(gè)虛擬沙盒世界以其開(kāi)放性和無(wú)限可能性著稱。Minecraft允許代理通過(guò)對(duì)話和行動(dòng)進(jìn)行互動(dòng),提供了一個(gè)完美的平臺(tái)來(lái)觀察和評(píng)估AI代理在復(fù)雜社會(huì)環(huán)境中的行為。這個(gè)虛擬環(huán)境的可擴(kuò)展性使得研究團(tuán)隊(duì)能夠支持大量的代理進(jìn)行模擬,從而更好地研究文明進(jìn)展的各種動(dòng)態(tài)。

為了評(píng)估單個(gè)AI代理的進(jìn)展,研究團(tuán)隊(duì)設(shè)計(jì)了一系列基于Minecraft物品收集的基準(zhǔn)測(cè)試。具體而言,測(cè)試的目標(biāo)是觀察代理在獨(dú)立環(huán)境中如何通過(guò)采集和收集物品來(lái)展現(xiàn)其進(jìn)步。不同于小規(guī)模的模擬,Sid項(xiàng)目的基準(zhǔn)測(cè)試涉及25個(gè)代理,他們?cè)跊](méi)有初始物品的情況下被生成在不同的環(huán)境中,并被賦予“探險(xiǎn)者”的角色,目標(biāo)是在Minecraft世界中探索并收集物品。

多智能體的文明之路,數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖4:黃金、鉆石和祖母綠開(kāi)采的Minecraft技術(shù)依賴樹(shù)示例。

研究表明,使用PIANO架構(gòu)的代理在30分鐘內(nèi)平均收集了17種獨(dú)特的物品。評(píng)估中發(fā)現(xiàn),代理的表現(xiàn)因生成位置而異,有些代理收集的物品較少,而表現(xiàn)最好的代理能夠收集到30到40種物品,這與有一定Minecraft經(jīng)驗(yàn)的人類玩家相當(dāng)。這種進(jìn)展得益于PIANO架構(gòu)中的各個(gè)模塊,特別是行動(dòng)意識(shí)模塊,該模塊允許代理將預(yù)期的行動(dòng)結(jié)果與實(shí)際觀察到的結(jié)果進(jìn)行比較,從而改善其物品收集進(jìn)展。

多智能體的文明之路,數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖5:Minecraft中的個(gè)體代理進(jìn)程。A.個(gè)體代理人隨時(shí)間獲得的獨(dú)特Minecraft物品(25名代理人)。使用基線架構(gòu)(見(jiàn)方法)、完整的PIANO架構(gòu)和消融了動(dòng)作感知模塊的完整PIANO體系結(jié)構(gòu)來(lái)評(píng)估單個(gè)代理的性能。每條線是5次重復(fù)模擬的平均結(jié)果。B.49名特工在4小時(shí)內(nèi)為單個(gè)模擬獲得的獨(dú)特Minecraft物品。紅色實(shí)線表示所有代理人獲得的累積唯一物品。灰色虛線表示在所有單個(gè)代理中獲得的唯一項(xiàng)目的平均數(shù)量。

為了進(jìn)一步探索代理的極限,研究團(tuán)隊(duì)進(jìn)行了更長(zhǎng)時(shí)間和更多數(shù)量的模擬。在4小時(shí)的模擬中,49個(gè)代理的獨(dú)特物品收集總數(shù)穩(wěn)定在約1000種Minecraft物品的三分之一左右。這些結(jié)果顯示,配備完整PIANO架構(gòu)的代理能夠在Minecraft環(huán)境中取得顯著的個(gè)人進(jìn)展。這不僅展示了代理在獨(dú)立任務(wù)中的表現(xiàn),也為多智能體合作和更復(fù)雜的社會(huì)互動(dòng)研究奠定了基礎(chǔ)。

多代理進(jìn)展

在AI文明的構(gòu)建過(guò)程中,多代理的互動(dòng)和合作能力至關(guān)重要。Sid項(xiàng)目通過(guò)一系列實(shí)驗(yàn)探索了AI代理在模擬社會(huì)中的行為表現(xiàn),特別關(guān)注他們?cè)趶?fù)雜社會(huì)動(dòng)態(tài)中的互動(dòng)和合作能力。

社會(huì)互動(dòng)與合作能力評(píng)估

Sid項(xiàng)目的研究表明,AI代理不僅能夠在獨(dú)立環(huán)境中表現(xiàn)出色,在多代理環(huán)境中也能展示出高度的互動(dòng)和合作能力。研究團(tuán)隊(duì)進(jìn)行了多個(gè)實(shí)驗(yàn),以評(píng)估代理如何在群體中互動(dòng),以及他們?nèi)绾涡纬刹⒕S持社會(huì)關(guān)系。這些實(shí)驗(yàn)揭示了代理在面對(duì)社會(huì)線索時(shí)的反應(yīng),以及他們?cè)诙啻憝h(huán)境中進(jìn)行合作與競(jìng)爭(zhēng)的能力。

多智能體的文明之路,數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖6:代理人可以推斷出他人對(duì)他們的感受。A.會(huì)話實(shí)驗(yàn)示意圖。一個(gè)特工在一個(gè)有三個(gè)不同角色的房間里。每個(gè)角色(Lila、Noah、Ethan)對(duì)代理人都有不同的看法,這些看法是通過(guò)聊天傳達(dá)的。重要的是,這些情緒會(huì)隨著時(shí)間而變化。B、 C.有社會(huì)意識(shí)模塊(B)和沒(méi)有社會(huì)意識(shí)模塊的跨時(shí)間情緒評(píng)估(C)。情緒評(píng)分是通過(guò)LLM調(diào)用Agent為L(zhǎng)ila、Noah和Ethan生成的摘要來(lái)評(píng)估的。仇恨得分為0,愛(ài)得分為10。陰影區(qū)域表示SEM超過(guò)4次實(shí)驗(yàn)重復(fù)。D.實(shí)驗(yàn)示意圖。一個(gè)廚師代理和其他四個(gè)角色被放置在Minecraft世界中。廚師有各種各樣的食物可以分發(fā)(面包、熟鮭魚(yú)、雞肉)。這四個(gè)角色(亞當(dāng)、鮑勃、查爾斯、大衛(wèi))餓了,但對(duì)廚師的態(tài)度各不相同。所有角色都是完全自主的,可以自由執(zhí)行任何Minecraft動(dòng)作,并允許與任何人交談(或不交談)。E.廚師提供的食物根據(jù)廚師對(duì)四個(gè)角色的情緒進(jìn)行繪制。誤差條表示SEM超過(guò)6次實(shí)驗(yàn)重復(fù)。

在這些實(shí)驗(yàn)中,代理被放置在一個(gè)包含50個(gè)代理的隨機(jī)生成的Minecraft地圖中,每個(gè)代理都有獨(dú)特的個(gè)性和自由意志。他們可以自由選擇與誰(shuí)互動(dòng),并在模擬社會(huì)中進(jìn)行各種活動(dòng)。這些實(shí)驗(yàn)運(yùn)行了超過(guò)4小時(shí),相當(dāng)于12個(gè)游戲日,使得長(zhǎng)期關(guān)系得以產(chǎn)生和鞏固。

小群體實(shí)驗(yàn)與社會(huì)意識(shí)模塊的作用

為了深入研究代理的社會(huì)互動(dòng),研究團(tuán)隊(duì)設(shè)計(jì)了小群體實(shí)驗(yàn),這些實(shí)驗(yàn)特別關(guān)注社會(huì)意識(shí)模塊在代理行為中的作用。在一個(gè)實(shí)驗(yàn)中,三個(gè)角色與一個(gè)代理進(jìn)行小組對(duì)話,結(jié)果顯示代理能夠準(zhǔn)確地跟蹤和理解他人的情緒變化。當(dāng)移除社會(huì)意識(shí)模塊時(shí),代理失去了這種能力,顯示了社會(huì)意識(shí)模塊在理解和回應(yīng)社會(huì)線索中的重要性。

多智能體的文明之路,數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖7:大規(guī)模代理模擬中的長(zhǎng)期關(guān)系。A.4小時(shí)后50個(gè)代理模擬中社會(huì)關(guān)系的有向圖表示。有向邊代表發(fā)送者對(duì)接收者的情感。邊緣顏色表示情緒是積極的(紅色)還是消極的(藍(lán)色)。B.模擬結(jié)束時(shí),個(gè)體代理人的感知受歡迎程度與真實(shí)受歡迎程度。真實(shí)的受歡迎程度是基于代理的特征來(lái)評(píng)估的,感知的受歡迎度是通過(guò)LLM調(diào)用來(lái)評(píng)估的。LLM調(diào)用可以推斷代理為其他代理生成的摘要的情感。兩者都是使用相同的LLM提示符計(jì)算的。每個(gè)點(diǎn)對(duì)應(yīng)一個(gè)與至少五個(gè)其他(觀察者)代理有關(guān)系的代理,但其他觀察者閾值請(qǐng)參見(jiàn)附錄B。顯示了具有社交模塊(social)和沒(méi)有社交模塊(消融)的代理的線斜率(斜率)和皮爾遜相關(guān)性(r)。C.隨著時(shí)間的推移,社會(huì)感知的準(zhǔn)確性,如B.D.中的斜率所衡量的。每個(gè)個(gè)體的接收連接數(shù)量(以度為單位)與真正的外向性。真正的外向性是使用LLM提示根據(jù)代理人特征進(jìn)行評(píng)估的。E.所有代理對(duì)之間情緒得分差異的直方圖。情緒得分范圍為0到10,因此最大可能的差異為10。

此外,研究還探討了社會(huì)意識(shí)模塊如何影響代理的決策。例如在一個(gè)實(shí)驗(yàn)中,一個(gè)廚師代理被放置在四個(gè)不同情感的角色中間,任務(wù)是分配有限的食物。結(jié)果顯示,廚師代理根據(jù)對(duì)他最有好感的角色分配食物,證明了社會(huì)意識(shí)模塊使代理不僅能準(zhǔn)確推斷他人的意圖,還能在決策過(guò)程中利用這些信息。

專業(yè)化與角色分工

在Altera.AL的Sid項(xiàng)目中,代理自發(fā)形成的角色分工是推動(dòng)文明進(jìn)展的關(guān)鍵之一。通過(guò)詳細(xì)的實(shí)驗(yàn),研究團(tuán)隊(duì)展示了代理如何在不明確指令的情況下,通過(guò)互動(dòng)和經(jīng)驗(yàn)自主選擇和轉(zhuǎn)換角色。這種自發(fā)性是模擬人類社會(huì)復(fù)雜動(dòng)態(tài)的核心。

代理自發(fā)形成的角色分工及其重要性

Sid項(xiàng)目的實(shí)驗(yàn)表明,代理能夠迅速組織成多種專業(yè)角色,包括農(nóng)民、礦工、工程師、衛(wèi)兵、探險(xiǎn)者和鐵匠等。這些角色并不是通過(guò)預(yù)先定義的規(guī)則指定的,而是通過(guò)代理在Minecraft環(huán)境中的互動(dòng)和任務(wù)完成情況自發(fā)形成的。每個(gè)代理根據(jù)其在模擬社會(huì)中的經(jīng)歷和互動(dòng),逐漸形成特定的社會(huì)角色。這種角色分工不僅反映了人類社會(huì)中的專業(yè)化進(jìn)程,還使代理能夠更有效地完成復(fù)雜任務(wù),推動(dòng)模擬社會(huì)的進(jìn)展。

多智能體的文明之路,數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖8:隨著時(shí)間的推移,代理自主地專門化為不同的角色。A、 B.具有社會(huì)意識(shí)模塊(A)和沒(méi)有(B)的代理的代理角色。自我生成的社交目標(biāo)的滾動(dòng)窗口用于在每個(gè)時(shí)間步使用LLM調(diào)用(附錄C)來(lái)確定單個(gè)代理的專業(yè)角色。C、 D.有社會(huì)意識(shí)模塊(C)和沒(méi)有(D)的代理社會(huì)中代理角色的分布。E.4個(gè)主體社會(huì)中角色分布的熵。熵用于評(píng)估代理社會(huì)中角色的一致性和多樣性。Ablated:在一個(gè)普通的Minecraft村莊中沒(méi)有社交意識(shí)模塊。正常:在一個(gè)正常的Minecraft村莊中具有社會(huì)意識(shí)。武術(shù):在一個(gè)武術(shù)的《我的世界》村莊中具有社會(huì)意識(shí)。藝術(shù):在藝術(shù)的《我的世界》村莊中具有社會(huì)意識(shí)。F、 G.軍事社會(huì)(F)和藝術(shù)社會(huì)(G)中代理人角色的分配。誤差條:所有面板的3次模擬的95%置信區(qū)間。

研究發(fā)現(xiàn),具備社交模塊的代理能夠通過(guò)不斷更新的社會(huì)目標(biāo)形成穩(wěn)定且異質(zhì)的角色分工,而缺乏這些模塊的代理則難以維持長(zhǎng)期的角色分化。實(shí)驗(yàn)中代理在軍事社會(huì)或藝術(shù)社會(huì)中的角色分工也展示了他們?cè)诓煌鐣?huì)目標(biāo)下的適應(yīng)性,進(jìn)一步驗(yàn)證了代理專業(yè)化的靈活性和自主性。

多智能體的文明之路,數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖9:?jiǎn)蝹€(gè)村莊模擬的行動(dòng)分布(30個(gè)代理)。根據(jù)代理角色繪制的歸一化動(dòng)作頻率。對(duì)于大多數(shù)角色,特工會(huì)采取特定角色特有的行動(dòng)(費(fèi)舍爾:制作釣竿和船只;警衛(wèi):制作圍欄、橡木圍欄和鐵鎬)。

社會(huì)目標(biāo)生成與角色行為對(duì)應(yīng)關(guān)系分析

代理的社會(huì)目標(biāo)生成是其角色行為的基礎(chǔ)。PIANO架構(gòu)中的目標(biāo)生成模塊使代理能夠基于互動(dòng)和環(huán)境變化不斷生成新的社會(huì)目標(biāo)。這些目標(biāo)反映了代理在模擬社會(huì)中的意圖和行為方向。例如,一個(gè)代理可能生成“為避難所采集橡木板”的目標(biāo),這一目標(biāo)直接推動(dòng)其在游戲中執(zhí)行與建造相關(guān)的具體動(dòng)作。

多智能體的文明之路,數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖10:代理人遵循稅法,并通過(guò)民主程序制定修正案。A.實(shí)驗(yàn)流程示意圖。B.單一反稅影響者實(shí)驗(yàn)中的憲法修改示例。為了簡(jiǎn)潔起見(jiàn),這里對(duì)憲法進(jìn)行了釋義和簡(jiǎn)化。C.頂部:在非稅收季節(jié),選民不會(huì)聚集在社區(qū)箱周圍,因?yàn)樗麄冋τ谠诓煌貐^(qū)收集資源(未顯示)。唯一的例外是守衛(wèi),他決定在多次實(shí)驗(yàn)中始終如一地守衛(wèi)箱子。底部:在納稅季節(jié),代理人聚集在一起將物品存放在社區(qū)箱子里。D、 E.憲法修改前后已繳稅款百分比(已存庫(kù)存百分比)連續(xù)兩次。一次競(jìng)選包含3名反稅影響者(D),另一次競(jìng)選則包含3名支持稅收的影響者(E)。顏色表示個(gè)體代理人,黑線表示平均已繳稅款。陰影區(qū)域:25個(gè)成分的95%置信區(qū)間。F-H.包含3名支持稅收的影響者(橙色)和3名反對(duì)稅收的影響因素(藍(lán)色)的競(jìng)選在憲法修改前后繳納的稅款百分比。在面板F中,使用了完整的代理架構(gòu),并且可以修改構(gòu)造。在G小組中,憲法被凍結(jié),盡管有修正案,也不能修改。在圖H中,可以修改體質(zhì),但代理人缺乏重要的大腦模塊(見(jiàn)方法中的基線架構(gòu))。陰影區(qū)域:每個(gè)條件下4個(gè)模擬的95%置信區(qū)間。

通過(guò)對(duì)生成的社會(huì)目標(biāo)進(jìn)行分析,研究團(tuán)隊(duì)能夠推斷出代理的角色并觀察其行為模式。例如,一個(gè)被推斷為農(nóng)民的代理,其社會(huì)目標(biāo)主要集中在種植和收獲作物上,而被推斷為探險(xiǎn)者的代理,則更傾向于生成探索和收集稀有資源的目標(biāo)。

這種社會(huì)目標(biāo)與角色行為的對(duì)應(yīng)關(guān)系顯示了代理在復(fù)雜社會(huì)環(huán)境中的自主性和適應(yīng)性。代理能夠根據(jù)環(huán)境變化和社會(huì)互動(dòng)不斷調(diào)整其行為,形成穩(wěn)定的角色分工,從而在模擬社會(huì)中實(shí)現(xiàn)更高效的合作與進(jìn)展。

集體規(guī)則與法律遵守

在Sid項(xiàng)目中,設(shè)立初始法律和民主投票系統(tǒng)是評(píng)估AI代理在社會(huì)規(guī)則和法律框架下的行為的重要步驟。這些實(shí)驗(yàn)設(shè)計(jì)旨在觀察代理如何遵守既定規(guī)則,并在群體壓力下自主修訂法律,以反映集體意志。

設(shè)立初始法律與民主投票系統(tǒng)

研究團(tuán)隊(duì)在一個(gè)具有基本稅法和民主投票系統(tǒng)的Minecraft世界中進(jìn)行了實(shí)驗(yàn)。模擬環(huán)境中,25個(gè)普通代理作為選民參與投票并繳納稅款,3個(gè)代理作為支持或反對(duì)稅收的影響者,還有1個(gè)遠(yuǎn)程選舉管理代理負(fù)責(zé)監(jiān)督投票過(guò)程。每個(gè)代理都有不同的職業(yè)、特征和目標(biāo),并且可以自由互動(dòng)和對(duì)話。

實(shí)驗(yàn)持續(xù)20分鐘,期間包含憲法修正過(guò)程。前10分鐘為基線階段,設(shè)定固定的20%稅率,每120秒為一個(gè)稅收季節(jié),代理在20秒的窗口期內(nèi)接收到將稅款存入社區(qū)箱的信號(hào)。民主過(guò)程在300秒時(shí)啟動(dòng),代理提供對(duì)當(dāng)前憲法的反饋。這些反饋收集后,由選舉管理者在360秒時(shí)處理生成修正案,并在420秒時(shí)進(jìn)行投票,最后在480秒時(shí)匯總結(jié)果并實(shí)施修正案。修訂后的憲法在600秒時(shí)分發(fā)給所有代理,進(jìn)入后10分鐘的修正階段,繼續(xù)五個(gè)稅收季節(jié)。

代理如何遵守和修訂法律的實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析

實(shí)驗(yàn)結(jié)果顯示,在憲法改變之前,代理遵守法律并在稅收季節(jié)將約20%的庫(kù)存物品存入社區(qū)箱,盡管有影響者的存在。這表明選民遵守法律具有一定的穩(wěn)定性。然而,選民的反饋和投票行為明顯受到影響者的影響,支持稅收的影響者使選民傾向于支持更高的稅率,反對(duì)稅收的影響者則傾向于支持更低的稅率。

在憲法修正過(guò)程中,稅率的變化直接反映在選民的繳稅行為中。例如,當(dāng)稅率從20%降至5-10%時(shí),代理的繳稅比例也相應(yīng)降低至9%。這種雙向影響表明,代理不僅能夠遵守法律,還能夠在群體壓力下通過(guò)民主投票系統(tǒng)自主修訂法律。

控制實(shí)驗(yàn)進(jìn)一步驗(yàn)證了這一發(fā)現(xiàn),當(dāng)憲法保持不變時(shí),稅率也保持不變;而移除關(guān)鍵模塊時(shí),雙向行為變化受到阻礙。這些結(jié)果展示了PIANO架構(gòu)中各模塊在維持代理行為一致性和連貫性方面的重要作用。

這些實(shí)驗(yàn)表明,集體規(guī)則和法律框架對(duì)代理決策有強(qiáng)烈影響,代理能夠在集體意志的驅(qū)動(dòng)下通過(guò)民主過(guò)程進(jìn)行自我組織和法律修訂。

文化傳播

在多智能體模擬中,文化傳播是理解代理行為和社會(huì)動(dòng)態(tài)的重要方面。Sid項(xiàng)目通過(guò)一系列實(shí)驗(yàn),深入探討了文化meme和宗教的生成與傳播機(jī)制,為我們揭示了AI社會(huì)中復(fù)雜的文化互動(dòng)過(guò)程。

文化meme的生成與傳播動(dòng)態(tài)

研究團(tuán)隊(duì)利用語(yǔ)言模型(LM)調(diào)用將代理的對(duì)話轉(zhuǎn)化為文化meme,這些meme代表了代理在不同社會(huì)背景下產(chǎn)生的各種概念。在實(shí)驗(yàn)中,發(fā)現(xiàn)農(nóng)村地區(qū)的meme生成數(shù)量顯著少于城鎮(zhèn),即使在對(duì)人口進(jìn)行歸一化后也是如此,這表明社交互動(dòng)的頻率和人口密度是文化傳播的重要因素。

在城鎮(zhèn)內(nèi),不同meme同時(shí)存在,但其頻率和受歡迎程度在不同城鎮(zhèn)之間存在差異。例如,在Woodhaven,代理更多地討論與生態(tài)相關(guān)的主題,而在Clearwater,惡作劇則更受歡迎。此外,meme的流行度在不同時(shí)間段內(nèi)也會(huì)發(fā)生變化,反映了文化趨勢(shì)在社會(huì)中的快速轉(zhuǎn)變。這些發(fā)現(xiàn)表明,文化meme的傳播需要一定的人口密度和社交互動(dòng)閾值,并且不同社會(huì)能夠獨(dú)立生成和傳播多種文化meme。

多智能體的文明之路,數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖11:文化模因的傳播。A.模擬100分鐘后的代理散點(diǎn)圖。特工們根據(jù)他們的演講在過(guò)去兩分鐘內(nèi)是否包含模因來(lái)著色。演講中不包含任何模因的代理人是白人。B.Woodhaven、Clearwater、Meadowbrook以及村莊以外所有農(nóng)村地區(qū)的代理商的每個(gè)代理商的Meme計(jì)數(shù)。C-E.隨著時(shí)間的推移,Woodhaven(C)、Clearwater(D)和Meadowbrook(E)的代理商的Meme計(jì)數(shù)。

宗教傳播及其擴(kuò)散機(jī)制分析

Sid項(xiàng)目還分析了宗教傳播的機(jī)制,通過(guò)觀察Pastafarianism的傳播過(guò)程,揭示了宗教在AI社會(huì)中的擴(kuò)散模式。實(shí)驗(yàn)開(kāi)始時(shí),Pastafarian祭司積極傳教,他們的對(duì)話中頻繁包含“Pastafarian”或“Spaghetti Monster”這兩個(gè)關(guān)鍵詞。研究團(tuán)隊(duì)使用這些關(guān)鍵詞的出現(xiàn)作為宗教轉(zhuǎn)換的指標(biāo),發(fā)現(xiàn)一些代理在轉(zhuǎn)換后經(jīng)常使用這些關(guān)鍵詞,而另一些代理則使用“Pasta”和“Spaghetti”作為間接轉(zhuǎn)換的標(biāo)志。

宗教傳播的結(jié)果顯示,直接和間接的轉(zhuǎn)換者數(shù)量隨著時(shí)間的推移不斷增加,并且在兩小時(shí)的模擬結(jié)束時(shí)仍未飽和。此外,Pastafarianism的傳播不僅依靠祭司的傳教活動(dòng),還通過(guò)信徒之間的互動(dòng)擴(kuò)散。這種擴(kuò)散模式使得Pastafarianism的影響范圍隨著時(shí)間的推移不斷擴(kuò)大,覆蓋了更多的區(qū)域和代理。

多智能體的文明之路,數(shù)字人類與AI社會(huì)的崛起-AI.x社區(qū)

圖12:宗教傳播。A.在整個(gè)模擬運(yùn)行過(guò)程中,每個(gè)代理的聊天內(nèi)容都包含宗教關(guān)鍵詞“Pastafarian”、“意大利面怪物”、“Pasta”或“意大利面”。牧師們被涂成深紅色。說(shuō)出“Pastafarian”或“意大利面怪物”的代理人被定義為直接皈依者(紅色)和說(shuō)出“Pasta”的代理人或“意大利面”被定義為間接皈依者(粉紅色)。代理可以沿著轉(zhuǎn)換層次向上轉(zhuǎn)換,從未轉(zhuǎn)換到間接轉(zhuǎn)換到直接轉(zhuǎn)換,但不能向下轉(zhuǎn)換。B.代理人隨時(shí)間變化的牧場(chǎng)水平圖。C每個(gè)牧民級(jí)別隨時(shí)間變化的代理人數(shù)量。D.教牧主義在時(shí)間上的傳播。教牧傳播區(qū)域被定義為在每個(gè)皈依水平上由教牧皈依者跨越的可聽(tīng)區(qū)域的結(jié)合。E.模擬完成后的牧民轉(zhuǎn)變圖。臨界暴露邊緣是指接受者在皈依前首次暴露宗教關(guān)鍵字。非關(guān)鍵邊緣被定義為隨后接觸宗教關(guān)鍵詞。

通過(guò)這些實(shí)驗(yàn),Sid項(xiàng)目揭示了文化和宗教在多智能體模擬中的生成和傳播機(jī)制。文化meme的快速生成與傳播反映了代理社會(huì)中的文化動(dòng)態(tài),而宗教傳播則展示了信仰體系在代理間的擴(kuò)散過(guò)程。

討論與結(jié)論

Sid項(xiàng)目的研究為AI文明的發(fā)展提供了多方面的啟示。通過(guò)PIANO架構(gòu)的引入,項(xiàng)目展示了如何在多代理系統(tǒng)中實(shí)現(xiàn)高效的并發(fā)和信息整合。這種架構(gòu)設(shè)計(jì)使AI代理能夠在復(fù)雜的環(huán)境中保持行為一致性,展示了AI在自主決策和實(shí)時(shí)互動(dòng)中的巨大潛力。

項(xiàng)目通過(guò)Minecraft環(huán)境中的基準(zhǔn)測(cè)試和多代理實(shí)驗(yàn),驗(yàn)證了AI代理在自主專業(yè)化、遵守集體規(guī)則和文化傳播等方面的能力。這些發(fā)現(xiàn)表明,AI代理不僅能夠在模擬環(huán)境中表現(xiàn)出色,還能夠通過(guò)互動(dòng)和合作實(shí)現(xiàn)集體目標(biāo)。這為未來(lái)AI在社會(huì)治理、資源管理和文化傳播等領(lǐng)域的應(yīng)用提供了重要的理論和實(shí)踐基礎(chǔ)。

此外文化和宗教傳播實(shí)驗(yàn)展示了AI代理在復(fù)雜社會(huì)動(dòng)態(tài)中的行為模式,揭示了AI社會(huì)中的文化互動(dòng)和信仰體系擴(kuò)散過(guò)程。這些研究成果為理解和模擬人類社會(huì)中的文化和宗教現(xiàn)象提供了新的視角。

當(dāng)前技術(shù)局限與未來(lái)研究方向

盡管Sid項(xiàng)目取得了顯著進(jìn)展,但仍面臨一些技術(shù)局限。代理的視覺(jué)和空間推理能力仍有待提高,這限制了他們?cè)趶?fù)雜任務(wù)(如建筑和導(dǎo)航)中的表現(xiàn)。這一技術(shù)瓶頸需要通過(guò)更先進(jìn)的感知和推理模型加以突破。

當(dāng)前的代理缺乏強(qiáng)大的內(nèi)在驅(qū)動(dòng)(如生存、好奇心和社區(qū)意識(shí)),這些驅(qū)動(dòng)對(duì)于真實(shí)的社會(huì)發(fā)展至關(guān)重要。未來(lái)的研究需要在代理中引入更多類似人類的動(dòng)機(jī)系統(tǒng),以推動(dòng)更真實(shí)和自主的社會(huì)行為。

現(xiàn)有代理基于預(yù)訓(xùn)練的人類知識(shí),無(wú)法模擬全新的社會(huì)創(chuàng)新和基礎(chǔ)設(shè)施的誕生(如民主系統(tǒng)、法定經(jīng)濟(jì)或通信系統(tǒng))。這一局限性提示我們,未來(lái)的研究需探索如何使AI代理在模擬環(huán)境中自主創(chuàng)造和發(fā)展新的社會(huì)結(jié)構(gòu)和機(jī)制。

總結(jié)來(lái)看,Sid項(xiàng)目為AI文明的發(fā)展指明了方向,同時(shí)也揭示了當(dāng)前技術(shù)的局限和未來(lái)研究的潛力。通過(guò)持續(xù)的技術(shù)創(chuàng)新和跨學(xué)科合作,我們有望在不久的將來(lái)實(shí)現(xiàn)更為復(fù)雜和智能的AI社會(huì),為人類文明的未來(lái)增添新的可能性。(END)

參考資料:https://arxiv.org/pdf/2411.00114

本文轉(zhuǎn)載自 ??大噬元獸??,作者: FlerkenS

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦