偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

人工智能開始理解和預(yù)測(cè)人的意圖

發(fā)布于 2025-10-9 07:54
瀏覽
0收藏

人工智能要真正走進(jìn)人類社會(huì),光會(huì)下棋、寫詩、畫畫、制作視頻還遠(yuǎn)遠(yuǎn)不夠。真正的挑戰(zhàn)在于它能否理解我們?cè)谙胧裁?、為什么這么做,并在關(guān)鍵時(shí)刻做出合理的預(yù)測(cè)。換句話說,AI 不僅要“聰明”,還要“懂人”。這就是所謂的社會(huì)智能 AI。

現(xiàn)有的方法在這條路上并不順利。最常見的“行為克隆”(Behavior Cloning, BC)就像小學(xué)生抄作業(yè),見過的題能做,換個(gè)場(chǎng)景就傻眼。逆向強(qiáng)化學(xué)習(xí)(Inverse Reinforcement Learning, IRL)則是另一種極端:它試圖從行為中推斷出背后的獎(jiǎng)勵(lì)函數(shù),但計(jì)算量大得驚人,常常在復(fù)雜環(huán)境里寸步難行。至于直接用大語言模型預(yù)測(cè)下一個(gè)動(dòng)作,效果雖有時(shí)驚艷,卻缺乏穩(wěn)定性和可解釋性,像個(gè)天馬行空的預(yù)言家。

認(rèn)知科學(xué)給了研究者一個(gè)啟發(fā):人類在日常生活中,其實(shí)并不會(huì)時(shí)時(shí)刻刻推理別人的“終極目標(biāo)”。更多時(shí)候,我們依賴的是“腳本化”的行為模式。比如看到紅燈就停下,看到餐桌就會(huì)找椅子坐下。這些腳本簡單、可復(fù)用,卻足以支撐復(fù)雜的社會(huì)互動(dòng)。

于是問題來了:如果人類的思維模式可以被看作一段段“腳本”,那么 AI 是否也能通過“代碼”來表達(dá)和預(yù)測(cè)他人的行為?這正是最新研究ROTE(Representing Others’ Trajectories as Executables)要解決的核心問題。

人工智能開始理解和預(yù)測(cè)人的意圖-AI.x社區(qū)

圖1:動(dòng)作預(yù)測(cè)方法的比較:行為克隆需要大量數(shù)據(jù)集,泛化能力有限,而逆向規(guī)劃在測(cè)試時(shí)的計(jì)算成本很高。研究團(tuán)隊(duì)的方法ROTE使用LLM來生成觀察到的行為的高效和可解釋的代碼表示,在效率和準(zhǔn)確性之間實(shí)現(xiàn)了卓越的平衡。

這項(xiàng)研究由華盛頓大學(xué)和約翰霍普金斯大學(xué)的團(tuán)隊(duì)聯(lián)合完成。第一作者 Kunal Jha 來自華盛頓大學(xué),專注于多智能體系統(tǒng)與社會(huì)智能;合作者 Aydan Yuenan Huang 則來自約翰霍普金斯大學(xué),研究機(jī)器如何理解他人的意圖。

團(tuán)隊(duì)中還有 Eric Ye,負(fù)責(zé)實(shí)驗(yàn)環(huán)境與基準(zhǔn)設(shè)計(jì);而兩位資深作者 Natasha Jaques 和 Max Kleiman-Weiner 則是社會(huì)強(qiáng)化學(xué)習(xí)與計(jì)算認(rèn)知科學(xué)領(lǐng)域的知名學(xué)者。他們的跨學(xué)科背景,讓這項(xiàng)研究既有技術(shù)的鋒利,也有認(rèn)知科學(xué)的深度。

ROTE為人工智能系統(tǒng)高效有效地預(yù)測(cè)現(xiàn)實(shí)世界中的人類行為開辟了一條道路。環(huán)境、算法、評(píng)估腳本等的代碼可以在以下網(wǎng)址找到。???https://github.com/KJha02/mindsAsCode.??

1.ROTE 框架

研究的最大亮點(diǎn)就是提出了一個(gè)新穎的框架:ROTE(Representing Others’ Trajectories as Executables)。顧名思義,它的目標(biāo)是把他人的行為軌跡表示為一段可執(zhí)行的程序。

與傳統(tǒng)方法不同,ROTE 并不試圖去推斷一個(gè)復(fù)雜的獎(jiǎng)勵(lì)函數(shù),也不滿足于簡單的模仿。它的核心思想是把行為軌跡轉(zhuǎn)化為可執(zhí)行的代碼腳本。這樣一來,AI 就能像人類一樣,依賴“腳本”來理解和預(yù)測(cè)他人的行為。

人工智能開始理解和預(yù)測(cè)人的意圖-AI.x社區(qū)

圖2:ROTE概述。ROTE通過生成和加權(quán)解釋其觀察到的行為的Python程序來預(yù)測(cè)代理的下一個(gè)動(dòng)作。從t=0到t=7,ROTE觀察藍(lán)色機(jī)器人的軌跡。最初,在t=1時(shí),與搬到餐廳相關(guān)的程序被加重。然而,在t=3時(shí),機(jī)器人拿起一個(gè)玩具,ROTE仍然不確定目標(biāo)是清理臥室里的玩具還是把它們放在客廳的椅子上。當(dāng)機(jī)器人在t=5時(shí)將玩具放在椅子上后,ROTE自信地更新其程序權(quán)重,以反映“將玩具帶到椅子上”的腳本。到t=7時(shí),ROTE可以使用此推斷腳本快速準(zhǔn)確地預(yù)測(cè)未來的行動(dòng)。

具體來說,ROTE 的技術(shù)路線分為兩步: 第一步,利用大語言模型生成候選程序。這些程序通常是Python 腳本,描述了某種可能的行為邏輯,比如“如果看到玩具,就把它搬到椅子上”。 第二步,使用 Sequential Monte Carlo 與貝葉斯推斷,對(duì)這些候選程序進(jìn)行篩選和加權(quán),最終找到最能解釋觀測(cè)到行為的那一個(gè)。

這種方法的優(yōu)勢(shì)非常明顯。首先是可解釋性:生成的程序是人類可讀的,研究者甚至可以直接運(yùn)行它,驗(yàn)證邏輯是否合理。其次是泛化性:腳本化的建模方式可以遷移到新環(huán)境中,不會(huì)像行為克隆那樣一換場(chǎng)景就失效。最后是高效性:相比逆向強(qiáng)化學(xué)習(xí)那種對(duì)目標(biāo)空間的窮舉推理,ROTE 避免了巨大的計(jì)算開銷。

換句話說,ROTE 就像給 AI 裝上了一本“行為劇本集”,既能快速翻閱,又能靈活改編,還能在新舞臺(tái)上繼續(xù)演出。

2.實(shí)驗(yàn)設(shè)計(jì)與驗(yàn)證

要驗(yàn)證“把他人思維建模為代碼”這件事是否靠譜,研究團(tuán)隊(duì)當(dāng)然不能只停留在理論層面。他們搭建了兩個(gè)風(fēng)格迥異的實(shí)驗(yàn)舞臺(tái):一個(gè)是簡潔抽象的二維格子世界,另一個(gè)則是復(fù)雜逼真的家庭/辦公室模擬環(huán)境。就像先在棋盤上練兵,再把 AI 丟進(jìn)真實(shí)的“家務(wù)戰(zhàn)場(chǎng)”,看看它能否應(yīng)對(duì)自如。

在Construction(Gridworld) 環(huán)境中,智能體需要完成一些基礎(chǔ)任務(wù),比如搬運(yùn)物品、巡邏路徑。這是一個(gè)高度可控的實(shí)驗(yàn)場(chǎng)景,研究者可以清晰地觀察 AI 是否學(xué)會(huì)了“腳本化”的行為邏輯。比如,當(dāng)它看到一個(gè)方塊時(shí),是否會(huì)像人類一樣遵循“撿起—搬運(yùn)—放下”的固定套路。

而在Partnr(Embodied Household Simulator) 環(huán)境中,情況就復(fù)雜得多了。這里模擬的是家庭或辦公室場(chǎng)景,任務(wù)包括收拾玩具、整理桌面、搬動(dòng)家具等。換句話說,這里不僅有空間的復(fù)雜性,還有任務(wù)的多樣性和不確定性。能在這種環(huán)境下預(yù)測(cè)人類或其他智能體的行為,才算是真正邁向“社會(huì)智能”。

當(dāng)然,光有舞臺(tái)還不夠,還得有對(duì)手。研究團(tuán)隊(duì)設(shè)置了幾種對(duì)比基線方法,來檢驗(yàn) ROTE 的實(shí)力。第一位出場(chǎng)的是老牌選手 行為克?。˙C),它的策略就是“看你怎么做,我就怎么學(xué)”,但一旦換個(gè)場(chǎng)景就容易失靈。第二位是 樸素法學(xué)碩士(Naive LLM, NLLM),直接用大語言模型來預(yù)測(cè)下一個(gè)動(dòng)作,結(jié)果往往顯得即興而缺乏穩(wěn)定性。最后是 AutoToM,一種神經(jīng)符號(hào)結(jié)合的方法,試圖在邏輯和神經(jīng)網(wǎng)絡(luò)之間找到平衡。

評(píng)估標(biāo)準(zhǔn)也很講究。研究者不僅看 AI 在單步預(yù)測(cè)上的準(zhǔn)確率,還考察它在多步預(yù)測(cè)中的表現(xiàn)——畢竟,預(yù)測(cè)別人下一秒要干什么和預(yù)測(cè)接下來一分鐘的行為,難度完全不同。

此外他們還測(cè)試了 泛化能力,也就是所謂的“零樣本遷移”:在一個(gè)全新環(huán)境里,AI 是否還能保持水準(zhǔn)。最后,研究團(tuán)隊(duì)甚至把 ROTE 的預(yù)測(cè)結(jié)果和人類的直覺進(jìn)行了對(duì)比,看看它是否真的接近“人類水平”的社會(huì)推理。

這一整套實(shí)驗(yàn)設(shè)計(jì),就像是一場(chǎng)層層遞進(jìn)的考驗(yàn):從棋盤到客廳,從單步到長時(shí)序,從模仿到遷移,再到與人類直覺的正面對(duì)比。結(jié)果如何?ROTE 在這些舞臺(tái)上的表現(xiàn),確實(shí)讓人眼前一亮。

3.實(shí)驗(yàn)結(jié)果與發(fā)現(xiàn)

真正的考驗(yàn)總是在舞臺(tái)燈光亮起之后。研究團(tuán)隊(duì)把 ROTE 推上了實(shí)驗(yàn)場(chǎng),結(jié)果顯示,它不僅能唱準(zhǔn)調(diào)子,還能在復(fù)雜的合奏中游刃有余。

人工智能開始理解和預(yù)測(cè)人的意圖-AI.x社區(qū)

圖3:ROTE在腳本(a)和人類代理(b)的單步和多步動(dòng)作預(yù)測(cè)方面都優(yōu)于所有基線。ROTE的基于代碼的表示將人類行為視為高效的腳本,使其能夠從有限的觀察中有效地進(jìn)行泛化。

對(duì)于單步預(yù)測(cè),ROTE在腳本(NLLM p<0.05,BC和AutoToM p<0.001)和人類藥物(BC p<0.05,NLLM p<0.01,AutoToM p<0.001)方面明顯比所有基線更準(zhǔn)確。在兩種試劑類型的多步預(yù)測(cè)中都保持了這種優(yōu)越的性能(腳本:BC、AutoToM和NLLM的p<0.001;人類:BC的p<0.01,NLLM和AutoToM的p<0.001)。ROTE實(shí)現(xiàn)了人類行為的人類水平預(yù)測(cè)準(zhǔn)確性。

首先是最直觀的指標(biāo)——預(yù)測(cè)準(zhǔn)確率。在單步預(yù)測(cè)和多步預(yù)測(cè)的任務(wù)中,ROTE 的表現(xiàn)都遠(yuǎn)遠(yuǎn)甩開了對(duì)手。與行為克隆、樸素 LLM 預(yù)測(cè)、AutoToM 等基線方法相比,它的準(zhǔn)確率提升幅度最高可達(dá)50%。這意味著,當(dāng)其他方法還在“差不多猜對(duì)”的水平徘徊時(shí),ROTE 已經(jīng)能穩(wěn)定地給出更接近真實(shí)的行為預(yù)測(cè)。

更令人驚喜的是它的泛化性。在全新的環(huán)境中,ROTE 展現(xiàn)了強(qiáng)大的零樣本遷移能力。換句話說,它并不需要在新場(chǎng)景里重新學(xué)習(xí),而是能直接把之前歸納出的“腳本”遷移過來繼續(xù)使用。

這就像一個(gè)經(jīng)驗(yàn)豐富的演員,換了舞臺(tái)和劇本,依然能迅速進(jìn)入角色。相比之下,行為克隆往往在新環(huán)境里完全失效,樸素 LLM 則容易出現(xiàn)“即興發(fā)揮過度”的問題。

人工智能開始理解和預(yù)測(cè)人的意圖-AI.x社區(qū)

圖4:ROTE展示了對(duì)Construction中新環(huán)境的卓越零射擊泛化能力。在不對(duì)代理行為進(jìn)行任何額外條件的情況下,ROTE程序從一個(gè)環(huán)境轉(zhuǎn)移到新設(shè)置的推斷比所有其他基線更有效(雙側(cè)t檢驗(yàn)中p<0.001)。

研究團(tuán)隊(duì)還進(jìn)行了人類實(shí)驗(yàn),把 ROTE 的預(yù)測(cè)與人類直覺進(jìn)行對(duì)比。結(jié)果顯示,ROTE 的預(yù)測(cè)準(zhǔn)確率已經(jīng)接近人類水平。這是一個(gè)相當(dāng)重要的信號(hào):它不只是比機(jī)器更聰明,而是開始在某種程度上“像人類一樣”去理解和推測(cè)他人的行為。

最后是計(jì)算效率。在長時(shí)序預(yù)測(cè)中,很多方法的計(jì)算開銷會(huì)隨著預(yù)測(cè)步數(shù)的增加而呈指數(shù)級(jí)膨脹,仿佛陷入了“未來越遠(yuǎn),越難看清”的困境。而ROTE 的開銷增長卻相對(duì)平緩,遠(yuǎn)低于其他方法。這意味著它不僅聰明,還很耐力十足,能夠在長時(shí)間的交互中保持高效。

ROTE 的表現(xiàn)幾乎在所有維度上都勝出:準(zhǔn)確率更高,泛化性更強(qiáng),預(yù)測(cè)更接近人類直覺,同時(shí)還能保持計(jì)算上的高效。它就像是一位既能背臺(tái)詞、又能即興表演,還不容易疲憊的演員,為人工智能理解和預(yù)測(cè)人類意圖開辟了一條全新的道路。

4.理論與方法論意義

研究最具顛覆性的地方,在于它把“預(yù)測(cè)他人行為”重新定義為一個(gè)程序歸納問題。在傳統(tǒng)的機(jī)器學(xué)習(xí)視角里,預(yù)測(cè)往往意味著擬合函數(shù)、優(yōu)化參數(shù),而在 ROTE 的框架下,預(yù)測(cè)更像是尋找一段最簡潔、最合理的程序來解釋觀測(cè)到的行為。

人工智能開始理解和預(yù)測(cè)人的意圖-AI.x社區(qū)

圖5:(a)大規(guī)模、部分可觀測(cè)Partnr環(huán)境中的預(yù)測(cè)精度。ROTE在預(yù)測(cè)目標(biāo)導(dǎo)向、基于LLM的代理行為方面表現(xiàn)出了卓越的能力,雙側(cè)t檢驗(yàn)顯示ROTE的表現(xiàn)明顯優(yōu)于所有其他模型(p<0.001)。(b)偽代碼示例說明了ROTE的推斷程序如何使用條件和狀態(tài)跟蹤來捕獲復(fù)雜的任務(wù)邏輯。

這與Solomonoff 歸納理論不謀而合:最短的程序往往是最優(yōu)的解釋。換句話說,AI 不再是“黑箱”里調(diào)參的苦工,而是一個(gè)在代碼空間里尋找“劇本”的編劇。

這種方法的另一個(gè)重大意義在于可解釋性。ROTE 生成的不是晦澀難懂的神經(jīng)網(wǎng)絡(luò)權(quán)重,而是一段段清晰的 Python 程序。研究者甚至可以直接讀懂這些代碼,看到其中的邏輯分支與條件判斷。比如,“如果看到玩具,就把它搬到椅子上”這樣的規(guī)則,不僅直觀,而且可以復(fù)用。這讓 AI 的推理過程第一次變得像一本打開的劇本,而不是一團(tuán)無法解讀的神經(jīng)網(wǎng)絡(luò)。

人工智能開始理解和預(yù)測(cè)人的意圖-AI.x社區(qū)

圖6:施工中的多步預(yù)測(cè)總時(shí)間。盡管在單步預(yù)測(cè)情況下比BC和Naive LLM提示慢,但ROTE的程序化表示使其多步計(jì)算成本能夠比其他方法更有效地?cái)U(kuò)展數(shù)量級(jí),使其比其他預(yù)測(cè)個(gè)體行為的方法更適合長期設(shè)置。

更重要的是,這種腳本化建模為社會(huì)智能 AI 提供了一條全新的路徑。人類的日常交互,本質(zhì)上就是在執(zhí)行各種“腳本”:見面打招呼、紅燈停綠燈行、餐桌上先擺盤再上菜。ROTE 的方法正好貼近這種邏輯,讓 AI 不再只是模仿動(dòng)作,而是學(xué)會(huì)了理解背后的“套路”。這意味著未來的 AI 在與人類互動(dòng)時(shí),可能會(huì)更自然、更符合直覺。

5.應(yīng)用前景與挑戰(zhàn)

如果說理論意義讓人眼前一亮,那么應(yīng)用前景則讓人浮想聯(lián)翩。

在人機(jī)協(xié)作領(lǐng)域,ROTE 的潛力巨大。想象一下,一個(gè)機(jī)器人助手能提前預(yù)測(cè)你要伸手去拿杯子,于是主動(dòng)把水倒好;或者在自動(dòng)駕駛場(chǎng)景中,AI 能夠推測(cè)出行人下一步可能要橫穿馬路,從而提前減速。這種預(yù)測(cè)能力,正是安全與高效的關(guān)鍵。

在多智能體系統(tǒng)中,ROTE 也能大顯身手。無論是金融市場(chǎng)的博弈模擬,還是多機(jī)器人協(xié)作任務(wù),理解和預(yù)測(cè)“他人”的行為都是核心問題。ROTE 提供了一種可解釋、可遷移的建模方式,讓智能體之間的互動(dòng)更像是有章可循的劇本,而不是混亂的即興表演。

在教育與訓(xùn)練方面,ROTE 甚至可以用來模擬人類的決策模式。比如在軍事訓(xùn)練、醫(yī)療教學(xué)或企業(yè)管理中,AI 可以扮演“虛擬對(duì)手”或“虛擬同事”,通過腳本化的行為模式來幫助學(xué)員理解復(fù)雜的社會(huì)互動(dòng)。

當(dāng)然,前景再美好,也不能忽視挑戰(zhàn)。首先是程序合成的復(fù)雜性與計(jì)算成本。雖然 ROTE 已經(jīng)比 IRL 高效,但在更復(fù)雜的環(huán)境中,生成和篩選程序仍然可能消耗大量資源。其次是行為腳本的多樣性與不可預(yù)測(cè)性。人類的行為并非總是遵循固定套路,偶爾的“即興發(fā)揮”可能讓 AI 措手不及。最后是與真實(shí)人類心理模型的差距。ROTE 的腳本化建模雖然貼近人類邏輯,但它畢竟不是人類的心智,仍然缺乏情感、動(dòng)機(jī)等更深層次的心理維度。

6.未來研究方向

ROTE 的提出只是一個(gè)開端,真正的挑戰(zhàn)還在前方。研究團(tuán)隊(duì)也清楚,要讓“代碼化思維建?!弊呦虺墒?,還需要在多個(gè)維度上繼續(xù)探索。

首先是更復(fù)雜環(huán)境的驗(yàn)證。目前的實(shí)驗(yàn)雖然已經(jīng)覆蓋了格子世界和家庭模擬,但這些環(huán)境仍然是相對(duì)封閉和可控的。未來的研究需要把 ROTE 放進(jìn)更開放的世界里,比如動(dòng)態(tài)的城市交通、多智能體的協(xié)作博弈,甚至是虛擬經(jīng)濟(jì)系統(tǒng)。在這些場(chǎng)景中,智能體之間的互動(dòng)更復(fù)雜,腳本之間的沖突與重疊也更頻繁,能否保持預(yù)測(cè)的準(zhǔn)確性和效率,將是對(duì) ROTE 的真正考驗(yàn)。

其次是與認(rèn)知科學(xué)的結(jié)合。ROTE 的靈感來自人類的“腳本化思維”,但這種思維模式在大腦中是如何實(shí)現(xiàn)的?它與神經(jīng)機(jī)制、記憶系統(tǒng)、甚至情緒調(diào)節(jié)之間有怎樣的關(guān)系?如果 AI 的腳本化建模能與認(rèn)知科學(xué)的實(shí)證研究相互印證,就有可能推動(dòng)我們對(duì)人類心智本身的理解。換句話說,ROTE 不僅是 AI 的工具,也可能成為認(rèn)知科學(xué)的實(shí)驗(yàn)平臺(tái)。

第三個(gè)方向是與政策和倫理的結(jié)合。可解釋 AI 一直是社會(huì)治理和合規(guī)領(lǐng)域的熱點(diǎn)。相比黑箱式的深度學(xué)習(xí),ROTE 生成的“腳本”天然具備可讀性和可審查性。這意味著它可能在金融監(jiān)管、自動(dòng)駕駛安全審查、甚至司法輔助決策中發(fā)揮作用。但與此同時(shí),如何確保這些腳本不會(huì)被誤解或?yàn)E用,如何在透明與隱私之間找到平衡,也是未來必須面對(duì)的倫理難題。

最后是跨學(xué)科的融合。ROTE 本身就是符號(hào) AI 與大語言模型的結(jié)合體,未來它還可以與博弈論、進(jìn)化計(jì)算、甚至經(jīng)濟(jì)學(xué)模型結(jié)合,形成更強(qiáng)大的社會(huì)智能框架。想象一下,一個(gè)既懂邏輯推理,又能進(jìn)行概率博弈,還能在復(fù)雜環(huán)境中即興發(fā)揮的 AI,將會(huì)是怎樣的存在?這正是跨學(xué)科融合所能帶來的前景。

7.結(jié) 論

研究團(tuán)隊(duì)為人工智能研究提供了一種全新的視角:把人的行為建模為代碼。通過 ROTE 框架,AI 不再只是模仿人類的動(dòng)作,而是學(xué)會(huì)了歸納和執(zhí)行“腳本”,從而在預(yù)測(cè)他人行為時(shí)展現(xiàn)出更高的準(zhǔn)確性、泛化性和可解釋性。

這項(xiàng)研究的意義在于,它推動(dòng) AI 從“模仿行為”走向“理解邏輯”。過去的 AI 更像是一個(gè)模仿者,看你怎么做就怎么學(xué);而 ROTE 讓 AI 更像是一個(gè)編劇,能從有限的片段中推斷出背后的劇本,并在新的舞臺(tái)上繼續(xù)演繹。這種轉(zhuǎn)變不僅提升了技術(shù)性能,也讓 AI 更貼近人類的社會(huì)交互邏輯。

ROTE 有望成為社會(huì)智能 AI 的重要基石。它的可解釋性讓它在政策與合規(guī)中具備獨(dú)特價(jià)值,它的腳本化邏輯讓它在教育、協(xié)作和多智能體系統(tǒng)中大有可為。更重要的是,它為跨學(xué)科研究開辟了新路徑,讓 AI 不再只是工程問題,而是與認(rèn)知科學(xué)、倫理學(xué)、經(jīng)濟(jì)學(xué)等領(lǐng)域深度對(duì)話的橋梁。

可以說,ROTE 不僅是一種算法,更是一種范式的轉(zhuǎn)變。它讓我們看到了一個(gè)未來:人工智能不只是會(huì)算賬的機(jī)器,而是能夠理解、預(yù)測(cè),甚至在某種程度上“共情”人類意圖的伙伴。

參考資料:???https://arxiv.org/pdf/2510.01272??

本文轉(zhuǎn)載自??波動(dòng)智能??,作者:FlerkenS

已于2025-10-9 07:54:23修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦