偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

李飛飛團隊創(chuàng)建深度學習「游樂場」:AI也在自我進化,細思極恐

新聞 人工智能
近日,斯坦福李飛飛教授等人的研究「深度進化強化學習」登上nature子刊,首次證明了「鮑德溫效應(yīng)」。或許,機器人形態(tài)的設(shè)計也可以通過一波「進化」來搞定?

 [[427578]]

動物的智慧是在和環(huán)境互動的過程中與身體形態(tài)同步進化的。

例如,倉鼠通過「進化」出長了好多腿的倉鼠球來逃避貓的追捕(doge)。

李飛飛團隊創(chuàng)建深度學習「游樂場」:AI也在自我進化,細思極恐

好吧,言歸正傳,AI也相當聰明,但與動物不同的是,AI通常是在硅基的芯片上實現(xiàn)的,并沒有實體。

那么,如果給AI一個「身體」,這對于智能的進化是否重要?如果是的話,又該如何利用來創(chuàng)造更聰明的人工智能?

在李飛飛的帶領(lǐng)下,斯坦福大學的研究小組創(chuàng)建了一個計算機模擬的「游樂場」——DERL(深度進化強化學習),其中被稱為「Unimals」(通用動物)的智能體在經(jīng)歷不斷變異和自然選擇。論文刊登在《自然通訊》雜志上。

李飛飛團隊創(chuàng)建深度學習「游樂場」:AI也在自我進化,細思極恐

https://www.nature.com/articles/s41467-021-25874-z

研究結(jié)果顯示,虛擬生物的身體形狀影響了它們學習新任務(wù)的能力,在更具挑戰(zhàn)性的環(huán)境中學習和進化的形態(tài),或者在執(zhí)行更復雜的任務(wù)時,比那些在更簡單的環(huán)境中學習和進化的形態(tài)學習進化得更快、更好。

在這項研究中,具有最成功的形態(tài)的Unimal也比前幾代更快地掌握了任務(wù),盡管它們最初的基線智力水平與前代相同。也就是說,「具身化」是智能進化的關(guān)鍵。

「我們通常專注于AI是如何實現(xiàn)人類大腦中神經(jīng)元的功能,」研究小組成員、斯坦福大學HAI的聯(lián)合主任李飛飛表示,「然而將AI看作是具有物理實體的東西是一種完全不同的范式?!?/p>

研究報告的共同作者、人文與科學學院應(yīng)用物理學副教授、HAI副主任Surya Ganguli說:「據(jù)我們所知,這是第一次相關(guān)的模擬實驗,其結(jié)果表明可以通過改變形態(tài)來加快學習的速度。」

「Unimal」宇宙

團隊設(shè)置了一個虛擬空間,并將簡單的模擬生物放入其中。當然,這些生物只是一些通過「隨機方式」進行移動的「幾何圖形」(Unimal)。

在學習階段中,有平坦的地形,有更具挑戰(zhàn)性的地形,包括塊狀山脊、階梯和光滑的山丘。Unimal必須在多變的地形上將一個塊狀物移動到目標位置。

訓練結(jié)束后,每個Unimal與其他三個在相同環(huán)境/任務(wù)組合中訓練過的Unimal進行比賽。勝者將產(chǎn)生一個單一的后代,該后代在面對與父母相同的任務(wù)之前,經(jīng)歷了一次涉及肢體或關(guān)節(jié)變化的突變。

最終,在訓練了4000種不同的形態(tài)后,團隊結(jié)束了模擬。此時,幸存的Unimal平均經(jīng)歷了10代的進化,其形態(tài)令人驚訝地多樣化,包括兩足動物、三足動物以及有手臂和無手臂的四足動物。

而最初,「幾乎圖形」只有一個「腦袋」和發(fā)達的「四肢」,他們有許多奇形怪狀的姿勢,「有些人蹣跚前行,有些如蜥蜴般的行走姿勢。其他人揮舞著十分逗趣的行為風格,讓人聯(lián)想到「八爪魚」。

[[427581]]

咦?看起來似乎與舊實驗沒區(qū)別,別急,進化才剛剛開始。

這些Unimal生長在不同的星球中,星球中充滿了「起伏的山丘」和「低矮的障礙物」,他們在更加激烈的環(huán)境中展開競爭??纯词欠袢绱蠹宜f,「逆境是成功之母」。

每個環(huán)境中的前 10 名Unimal被安排在了新任務(wù)中,從「新障礙」到將球移動到目標位置、將盒子推上山或在兩點之間巡邏。這些「角斗士」真正展示了他們的虛擬勇氣。

最終,那些能在「復雜的地形中」行走的 Unimal 比在「平地上的表親」更快地學習新任務(wù),并且完成的更好。

換句話說,它們通過「生存」而「進化」,但并不是「邊做邊學」。而是在復雜的環(huán)境中同時進行「進化」和「學習」,比如有臺階、丘陵、山脊和移動的地形,以便在這些復雜環(huán)境中進行操作。

在平坦的地形上,「章魚flop」可能會以相同的時間到達終點線,但「適應(yīng)山丘和山脊的身體配置」往往是更快速、更穩(wěn)定和能力最強的。他們多才多藝的身體能夠更好的利用他們的經(jīng)驗教訓 - 很快他們就將競爭對手拋在了腦后。

都交給「進化」去做吧

李飛飛團隊創(chuàng)建深度學習「游樂場」:AI也在自我進化,細思極恐

通用計算框架DERL利用兩個相互作用的適應(yīng)過程來制造具身的智能體

進化的外循環(huán)通過變異操作優(yōu)化智能體的形態(tài)(b),內(nèi)部強化學習循環(huán)優(yōu)化了神經(jīng)控制器的參數(shù)(c)。在可變地形的操縱中,智能體必須從初始位置(綠色球體)開始,將一個盒子移動到目標位置(紅色方塊)。

在每個環(huán)境完成三次進化運行后(每次有4000種形態(tài)),團隊從每個環(huán)境中挑選出表現(xiàn)最好的10個Unimal,并從頭開始訓練它們完成8項全新的任務(wù),如繞過障礙物、操縱一個球或?qū)⒁粋€箱子推上斜坡。

最成功的Unimal在個體(通過較少的訓練獲得更好的表現(xiàn))和跨代的學習方面也更快。團隊發(fā)現(xiàn),在早期祖先生命后期習得的行為能夠在他們的后代生命早期表達出來。

此外,在10代之后,最成功的Unimal形態(tài)在學習同一任務(wù)的時間是其最早祖先的一半。

這也驗證了美國心理學家James Mark Baldwin在19世紀末提出的假設(shè):「學習具有適應(yīng)性優(yōu)勢的事物的能力」可以通過達爾文的自然選擇來傳承。

人類不一定知道如何為奇怪的任務(wù)設(shè)計機器人的身體,例如爬過核反應(yīng)堆提取廢物,在地震后提供救災(zāi),引導納米機器人穿過人體,甚至做洗碗或疊衣服等家務(wù)。

或許,設(shè)計這些機器人的唯一出路就是交給「進化」去實現(xiàn)。

 

責任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2017-09-13 13:54:09

2019-12-27 08:33:45

Java工具IDE

2021-02-07 10:01:31

AI 數(shù)據(jù)人工智能

2022-08-11 10:25:01

U盤Python代碼

2022-08-21 10:32:38

python

2022-10-08 11:18:08

光攻擊Zoom

2018-08-23 15:47:43

個人信息安全

2018-12-05 12:59:28

比特幣區(qū)塊鏈BTC

2019-08-28 13:44:51

人工智能AI機器人

2023-03-24 12:10:47

面部識別算法

2019-03-04 08:11:53

AIDeepFakes深度學習

2014-07-10 10:15:41

代碼代碼庫

2025-04-30 09:20:00

2015-10-28 16:32:52

人工智能谷歌搜索算法

2010-09-01 10:43:35

丁磊

2018-02-27 11:11:20

Wi-Fi

2023-01-11 12:51:04

微軟音頻

2024-11-29 14:30:00

AI模型

2021-08-31 10:39:52

語音克隆MockingBird合成器

2021-02-25 11:03:46

人工智能
點贊
收藏

51CTO技術(shù)棧公眾號