偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Hinton預(yù)言的「AI將擁有常識(shí)」如何實(shí)現(xiàn)?劍橋最新研究:從小狗學(xué)起

新聞 人工智能
最近,谷歌DeepMind、帝國理工和劍橋的研究人員開創(chuàng)性地提出,AI可以從動(dòng)物身上學(xué)習(xí)常識(shí)!今后可以像訓(xùn)練小狗一樣訓(xùn)練智能體了。

 常識(shí)一直是困擾AI發(fā)展的難解謎題。就算AI能夠在圍棋比賽中戰(zhàn)勝人類,但機(jī)智如GPT-3卻不能理解「太陽有幾只眼睛」這種問題是反常識(shí)的。而最近,谷歌DeepMind、帝國理工和劍橋的研究人員開創(chuàng)性地提出,AI可以從動(dòng)物身上學(xué)習(xí)常識(shí)!今后可以像訓(xùn)練小狗一樣訓(xùn)練智能體了。

Geoffery Hinton曾經(jīng)預(yù)言,十年內(nèi),我們將研發(fā)出具有常識(shí)的計(jì)算機(jī)。

這些計(jì)算機(jī)并沒有靈魂,它們只是具備了人類世界如何運(yùn)作的知識(shí),熟悉我們的慣例。它們知道爐子是熱的,知道人們通常不會(huì)買12臺(tái)烤箱等等。

常識(shí)是什么?最通俗的解釋是指與生俱來、毋須特別學(xué)習(xí)的判斷能力,或是眾人皆知、無須解釋或加以論證的知識(shí)。

[[348961]]

數(shù)十年來,常識(shí)是一直以來困擾著AI發(fā)展的難解謎題,就算AI能夠在圍棋比賽和Atari游戲中戰(zhàn)勝人類,但聰明如GPT-3卻不能理解「太陽有幾只眼睛」這種問題是違背常識(shí)的。

在如何讓AI擁有常識(shí)的漫長求索之路上,研究人員往往會(huì)從嬰幼兒身上入手,從神經(jīng)科學(xué)和行為科學(xué)中尋找靈感和答案。

而最近,谷歌 DeepMind、倫敦帝國理工學(xué)院和劍橋大學(xué)的人工智能研究人員開創(chuàng)性地提出,AI可以從動(dòng)物身上學(xué)習(xí)常識(shí)!

這其實(shí)不是第一次提出AI應(yīng)該向動(dòng)物學(xué)習(xí)了,AI大神Yann LeCun曾表示,「家貓都比最聰明的機(jī)器有常識(shí)得多?!?/p>

[[348963]]

人的常識(shí)是建立在許多其他動(dòng)物所擁有的一系列基本能力之上的,而通過深度強(qiáng)化學(xué)習(xí),智能體或許可以從動(dòng)物身上學(xué)到很多東西。

該研究小組發(fā)表在《 CellPress Reviews 》雜志上的論文《人工智能與動(dòng)物常識(shí)》(Artificial Intelligence and the Common Sense of Animals)寫道: 「動(dòng)物認(rèn)知提供了一個(gè)很好理解的,非語言的,智能行為的概要,提出了作為評(píng)估基準(zhǔn)的實(shí)驗(yàn)方法,它以指導(dǎo)環(huán)境和任務(wù)設(shè)計(jì)?!?/p>

向小狗學(xué)習(xí)?像訓(xùn)練寵物一樣訓(xùn)練智能體

在著名的伊索寓言中,試驗(yàn)者要求鳥類將物體投入裝有水和浮動(dòng)食物的玻璃管中,提升水位,來獲取食物。

[[348964]]

訓(xùn)練動(dòng)物的過程,通常包含著目標(biāo)和獎(jiǎng)勵(lì)。比如說訓(xùn)練小狗,動(dòng)作做的對(duì),就獎(jiǎng)勵(lì)他食物,這和運(yùn)用深度強(qiáng)化學(xué)習(xí)訓(xùn)練智能體的方式有相似之處。

[[348965]]

相比之下,其他形式的人工智能,例如助手 Alexa 或 Siri,就不具備這種類似于在迷宮中搜索獎(jiǎng)勵(lì)或食物的能力。

此前,認(rèn)知行為科學(xué)家已經(jīng)發(fā)現(xiàn),動(dòng)物的智力水平比先前設(shè)想的要高,包括海鴉的復(fù)仇心理和海豚的自我意識(shí)。(小孩子要長到一歲半時(shí)才能有自我意識(shí),才能認(rèn)出鏡子里自己的形象)

[[348966]]

很多時(shí)候,動(dòng)物甚至?xí)扇∑垓_或者詭計(jì)來達(dá)成自己的目的。例如,黑猩猩把目光從渴望得到的東西上移開,來迷惑競爭對(duì)手,而松鴉會(huì)假裝把食物儲(chǔ)存在虛假的地點(diǎn)來保護(hù)它們的隱秘儲(chǔ)藏處。

實(shí)驗(yàn)中,研究人員將測試場景中的動(dòng)物和強(qiáng)化學(xué)習(xí)智能體進(jìn)行類比,用一種新的方法來測試人工智能系統(tǒng)的認(rèn)知能力?!度斯ぶ悄芘c動(dòng)物常識(shí)》一文細(xì)講述了對(duì)鳥類和靈長類動(dòng)物的認(rèn)知實(shí)驗(yàn)。

這個(gè)實(shí)驗(yàn)最初的目的是確定鳥類是否能夠區(qū)分與任務(wù)相關(guān)的功能性和非功能性物體,并探索它們對(duì)所涉及的因果關(guān)系的理解程度。

做的好才有的吃,學(xué)會(huì)理解因果,要先試錯(cuò)!

松鼠會(huì)想辦法撬開堅(jiān)果的外殼,獲取里面的果實(shí);某些鸚鵡也十分擅長從各種容器中提取食物;當(dāng)看到裂縫,孔洞或破裂之類的東西時(shí),有的動(dòng)物會(huì)作出「我要打開它」的反應(yīng)。

這是為什么?這是它們的意識(shí)中有了「因果」這一概念。

也就是,「只要我打開它,就會(huì)有食物?!苟@,也是AI要訓(xùn)練的部分。

作者聯(lián)想到訓(xùn)練動(dòng)物的方法,發(fā)現(xiàn)「試錯(cuò)」是十分奏效的。

來源于動(dòng)物認(rèn)知實(shí)驗(yàn),用來測試強(qiáng)化學(xué)習(xí)智能體獲取的常識(shí)

如上圖,

(A)使用四種不同形式的管道測試物理認(rèn)知能力。如果棍子從錯(cuò)誤的一端拔出,食物就會(huì)丟失。通過試錯(cuò)來應(yīng)對(duì)不同情況(i),只學(xué)會(huì)了表面聯(lián)想的動(dòng)物,在遷移任務(wù)[變異]中往往表現(xiàn)不佳 (ii)至(iv))],而已獲得因果理解的動(dòng)物往往在第一次試驗(yàn)中表現(xiàn)良好。

(B)用一個(gè)看不見的位移任務(wù)來測試對(duì)物體永久性的理解。在用食物做誘餌后,杯子被移動(dòng)至右邊所示的最終排布。然后,動(dòng)物要選擇盛有食物的杯子。當(dāng)然,杯子是不透明的,但是食物的位置能夠清晰地顯示出來。能夠理解這種看不見的位移的動(dòng)物在所有四種不同情況中都表現(xiàn)得很好,即使它以前從未見過相關(guān)的物體。

而足夠逼真的3D世界模擬,是訓(xùn)練的必要條件,包括可能會(huì)破裂或被撬開的貝殼,無法擰開或撬開的瓶蓋,可撕開的包裝盒等等物體。

訓(xùn)練RL智能體的3D環(huán)境

(A)DeepMind游戲室環(huán)境

(B)與前者相同,不過是智能體視角下

智能體可以在場景中移動(dòng),并推動(dòng)物體。在游戲室的環(huán)境中,智能體也可以拿起物品并把它們放下,它通過成功地執(zhí)行自然語言指令獲得獎(jiǎng)勵(lì),比如「把一個(gè)泰迪熊放在一個(gè)藍(lán)色的方塊上」。在動(dòng)物AI環(huán)境中,智能體通過移動(dòng)綠色球體獲得獎(jiǎng)勵(lì)。

更為有趣的是,為了精準(zhǔn)模仿動(dòng)物與食物的因果關(guān)系。研究人員將綠色物體定位為「食物」,當(dāng)被觸摸時(shí)會(huì)產(chǎn)生積極的獎(jiǎng)勵(lì),然后就像被吃掉一樣消失。

[[348968]]

更高層次的常識(shí):類比和隱喻,AI:我太難了

總結(jié)來說,常識(shí)是人類獨(dú)有的嗎?研究人員認(rèn)為,并不是,常識(shí)是取決于一些基本概念的。比如,眼前的物體是什么?它會(huì)占據(jù)多大空間?以及因果之間的關(guān)系等等。

而且,這些理解被深深地刻進(jìn)頭腦,并不會(huì)隨著時(shí)間的推移而發(fā)生改變。

然而,動(dòng)物所表現(xiàn)出來的常識(shí),很可能就包含對(duì)獎(jiǎng)勵(lì)的認(rèn)知。

「如何構(gòu)建這樣的人工智能技術(shù)仍然有待解答。但是我們提倡一種方法,讓 RL 智能體通過與豐富的虛擬環(huán)境進(jìn)行擴(kuò)展交互來獲得所需的東西?!?/p>

因此,通過適當(dāng)?shù)娜蝿?wù)訓(xùn)練智能體,很可能就能為AI賦予常識(shí)。

[[348969]]

當(dāng)然,常識(shí)也不僅僅是這些。物理學(xué)只是常識(shí)的一個(gè)領(lǐng)域。我們忽略了一些心理學(xué)概念(如相信某件事或表達(dá)出不開心)以及相關(guān)的常識(shí)性社會(huì)概念(如與某人某物在一起,或給予某人某物)。

物理上講,上述實(shí)驗(yàn)的重點(diǎn)是固體。更完整的還應(yīng)該包括液體(水坑、溪流、瓶中的酒)、氣態(tài)物質(zhì)(煙、霧、火焰)和顆粒物(土壤、沙子),甚至包括可變形物體(海綿、紙張、繩子、衣服、樹葉、樹枝、動(dòng)物的身體)和空間(洞、門道、入口)等。

從這個(gè)意義上講,常識(shí)可以看作是一組相互關(guān)聯(lián)的基本原則和抽象概念。更高更抽象的層面上,還包括類比和隱喻的運(yùn)用。

[[348970]]

「理想情況下,我們希望建立一種AI技術(shù)能夠把握這些(關(guān)于認(rèn)知的)相互關(guān)聯(lián)的原則和概念,并擁有人類層面的概括和創(chuàng)新能力」論文的最后寫道。

看來,讓AI擁有常識(shí)終歸是一條漫漫長路。

 

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2022-04-07 14:44:24

人工智能計(jì)算神經(jīng)網(wǎng)絡(luò)

2023-12-11 19:08:03

AI模型

2022-12-06 09:44:00

算法神經(jīng)網(wǎng)絡(luò)

2025-01-02 13:50:35

2025-06-25 08:00:05

2025-02-06 14:35:39

2025-06-05 09:05:36

2021-06-15 09:19:11

存儲(chǔ)技術(shù)容器

2023-05-22 18:39:03

2017-11-22 19:00:51

人工智能深度學(xué)習(xí)膠囊網(wǎng)絡(luò)

2015-10-16 10:03:36

安卓設(shè)備安全終端安全

2017-07-11 13:27:31

人工智能機(jī)器智能

2019-11-28 09:42:46

人工智能AI精準(zhǔn)醫(yī)療

2021-04-27 09:30:47

AI 數(shù)據(jù)人工智能

2023-06-16 13:02:22

GPT-5GPT-4AI

2021-07-19 14:37:04

AI 數(shù)據(jù)人工智能

2020-10-05 22:11:21

AI 數(shù)據(jù)人工智能

2023-07-25 14:28:52

人工智能醫(yī)療硬件
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)