偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<u id="3xqvp"></u>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

炸場(chǎng)！DeepMind通用人工智能新突破：一套權(quán)重通吃視覺文本和決策

作者：夢(mèng)晨魚羊 2022-05-13 14:56:03

人工智能新聞

只一個(gè)模型，使用相同的權(quán)重，不僅把看家本領(lǐng)雅達(dá)利游戲玩得飛起。

本文經(jīng)AI新媒體量子位（公眾號(hào)ID:QbitAI）授權(quán)轉(zhuǎn)載，轉(zhuǎn)載請(qǐng)聯(lián)系出處。

通用人工智能，還得看DeepMind。

這回，只一個(gè)模型，使用相同的權(quán)重，不僅把看家本領(lǐng)雅達(dá)利游戲玩得飛起。

和人類聊聊天、看圖寫話也不在話下。

甚至還能在現(xiàn)實(shí)環(huán)境里控制機(jī)械臂，讓其聽從指令完成任務(wù)！

模型名為Gato，西班牙語(yǔ)中的“貓”。

按照DeepMind的說法，這只貓貓可以使用具有相同權(quán)重的同一個(gè)神經(jīng)網(wǎng)絡(luò)，適應(yīng)各種不同的環(huán)境。

具體而言，DeepMind讓它在604個(gè)不同的任務(wù)上接受了訓(xùn)練，這些任務(wù)模式完全不同，需要觀察的元素和行為規(guī)則也不同。

而Gato不僅在450個(gè)任務(wù)中都超過了專家水平的50%，在23個(gè)雅達(dá)利游戲上表現(xiàn)還超過人類平均分。

DeepMind CEO哈薩比斯直接說：

這是我們目前最通用的智能體。

這一最新成果一發(fā)布，當(dāng)即就在AI圈子里掀起熱議。

有AI研究者指出：

Gato令人印象深刻。只需要在云上花費(fèi)5萬(wàn)美元，就能完成對(duì)它的訓(xùn)練。
這點(diǎn)錢只是PaLM訓(xùn)練費(fèi)用1100萬(wàn)美元的一個(gè)零頭。用PaLM的預(yù)算完全可以將Gato擴(kuò)展100倍，而這很可能是行之有效的。

PaLM是谷歌發(fā)布的5400億參數(shù)語(yǔ)言模型。

有人直接祭出了AlphaStar架構(gòu)和Gato架構(gòu)的對(duì)比：

Zoom AI杰出科學(xué)家Awni Hannun則直接感嘆起過去5周以來(lái)，谷歌/DeepMind釋出成果之密集。

所以這只來(lái)自DeepMind的“貓貓”，究竟怎么一回事？

一個(gè)Transformer搞定一切

對(duì)于研究方法，DeepMind只用一句話就解釋明白了：

我們受到語(yǔ)言大模型的啟發(fā)，用類似的方法把模型能力拓展到文本之外的領(lǐng)域。

沒錯(cuò)，這次立功的又是語(yǔ)言大模型中常用的Transformer架構(gòu)。

Transformer的本質(zhì)就是把一個(gè)序列轉(zhuǎn)換(transform)成另一個(gè)序列。

所以要想讓它掌握各種不同任務(wù)，首先就需要把各類數(shù)據(jù)都編碼成序列。

文本自不必說，天然就是序列信息，可用經(jīng)典的SentencePiece編碼。

圖像，ViT已經(jīng)打好樣，先按16x16像素分割，再給每個(gè)像素編上號(hào)處理成序列。

玩游戲時(shí)的按鍵輸入同樣是序列，屬于離散值，比如懂得都懂的“上上下下左右左右BABA”。

操縱機(jī)器人時(shí)的傳感器信號(hào)和關(guān)節(jié)力矩屬于連續(xù)值，也通過一系列采樣和編碼處理成離散序列。

最終，所有序列數(shù)據(jù)都交給同一個(gè)Transformer處理。

整個(gè)Gato模型使用的訓(xùn)練數(shù)據(jù)總體上偏向游戲和機(jī)器人控制任務(wù)，596個(gè)任務(wù)占了85.3%。視覺和自然語(yǔ)言任務(wù)只占14.7%。

模型架構(gòu)上，為了簡(jiǎn)潔和可擴(kuò)展性，就在最經(jīng)典的原版Transformer基礎(chǔ)上小改，具體參數(shù)如下：

24層11.8億參數(shù)版的Gato，在谷歌16x16 Cloud TPUv3切片上訓(xùn)練了大約4天。

到了部署階段，Gato對(duì)于視覺和語(yǔ)言任務(wù)就像傳統(tǒng)Transformer和ViT那樣運(yùn)行。

對(duì)于游戲和機(jī)器人控制的行為模式則可以理解為“走一步看一步”。

首先給出一個(gè)任務(wù)提示，比如游戲操作或機(jī)器人動(dòng)作，作為輸出序列的開頭。

接下來(lái)Gato會(huì)觀察當(dāng)前的環(huán)境，對(duì)動(dòng)作向量進(jìn)行一次自回歸采樣，執(zhí)行動(dòng)作后環(huán)境發(fā)生變化，再重復(fù)這個(gè)過程……

那么這樣訓(xùn)練出來(lái)的Gato，在各項(xiàng)任務(wù)中到底表現(xiàn)如何？

僅靠12億參數(shù)成為多面手

玩游戲方面，Gato的表現(xiàn)可以用一張圖來(lái)總結(jié)。

x軸是訓(xùn)練集之中專家水平的百分比，其中0代表一個(gè)隨機(jī)參數(shù)模型的水平。

y軸是Gato超過或達(dá)到對(duì)應(yīng)專家水平的任務(wù)數(shù)量。

最終結(jié)果，Gato在604個(gè)任務(wù)中，有450個(gè)超過了專家水平的50%。

更詳細(xì)的結(jié)果如下：

雅達(dá)利游戲測(cè)試中，Gato在23個(gè)游戲上表現(xiàn)超過人類平均分，11個(gè)游戲上比人類得分高一倍。

這些游戲包括經(jīng)典的乒乓球、賽車，也包括射擊、格斗等多種類型。

在Bengio團(tuán)隊(duì)推出的BabyAI測(cè)試上，Gato幾乎在所有關(guān)卡達(dá)到了專家水平的80%，最難的幾個(gè)Boss關(guān)達(dá)到75%。與之前BabyAI榜單上的兩個(gè)模型水平相當(dāng)（分別為77%和90%），但這兩個(gè)模型都針對(duì)性的用了上百萬(wàn)個(gè)演示來(lái)訓(xùn)練。

△BabyAI關(guān)卡示例

在Meta-World上（虛擬環(huán)境中操作機(jī)械臂），Gato在全部45個(gè)任務(wù)中，有44個(gè)超過專家水平的50%，35個(gè)超過80%，3個(gè)超過90%。

△Meta-World任務(wù)示例

操縱真實(shí)機(jī)器人方面，與之前模型對(duì)比也不遑多讓。

至于視覺和文本任務(wù)DeepMind這次至少為了驗(yàn)證通用模型的可行性，沒有做跑分，而是給了一些示例。

△描述圖像

△聊天對(duì)話

最后，DeepMind還對(duì)Gato模型的可擴(kuò)展性做了評(píng)估。

雖然當(dāng)前Gato在每一個(gè)單獨(dú)任務(wù)上都還比不上SOTA結(jié)果，但實(shí)驗(yàn)結(jié)果表明，隨著參數(shù)、數(shù)據(jù)和硬件的增加，Gato模型的性能還有成比例上漲的空間。

另外，Gato在少樣本學(xué)習(xí)上也表現(xiàn)出一定潛力。

DeepMind認(rèn)為，這樣一個(gè)通用模型將來(lái)可通過提示或微調(diào)迅速學(xué)習(xí)新的任務(wù)，再也不用為每個(gè)任務(wù)都重頭訓(xùn)練一個(gè)大模型了。

通用人工智能還有多遠(yuǎn)？

看完Gato如此表現(xiàn)，網(wǎng)友們的“大受震撼”也就不奇怪了。

甚至還有人認(rèn)為，AGI（通用人工智能）近在眼前。

當(dāng)然，反對(duì)/質(zhì)疑的聲音也不小。

比如始終沖在給人工智能潑冷水一線的馬庫(kù)斯，這次也第一時(shí)間開了炮：

仔細(xì)看看第10頁(yè)。無(wú)論模型有多大，大型語(yǔ)言模型標(biāo)志性的不靠譜和錯(cuò)誤信息仍然存在。

但不管怎么說，DeepMind在通用人工智能方向上的努力都在不斷涌現(xiàn)出新成果。

事實(shí)上，無(wú)論是2013年驚艷了谷歌的雅達(dá)利游戲AI，還是名滿全球的AlphaGo、AlphaStar，DeepMind透過這些階段性成果想要達(dá)成的終極目標(biāo)，一直都通向通用人工智能這個(gè)關(guān)鍵詞。

去年，DeepMind首席研究科學(xué)家、倫敦大學(xué)學(xué)院教授David Silver還領(lǐng)銜發(fā)布了一篇同樣引起不少討論的文章：Reward is Enough。

論文認(rèn)為，強(qiáng)化學(xué)習(xí)作為基于獎(jiǎng)勵(lì)最大化的人工智能分支，足以推動(dòng)通用人工智能的發(fā)展。

而據(jù)Gato團(tuán)隊(duì)成員透露，這只“貓貓”已經(jīng)在DeepMind內(nèi)部孕育了2年時(shí)間。

此次Gato是以有監(jiān)督方式進(jìn)行離線訓(xùn)練的，但論文也強(qiáng)調(diào)，原則上，同樣可以采用離線或在線強(qiáng)化學(xué)習(xí)的方式對(duì)其進(jìn)行訓(xùn)練。

而就在一周前，DeepMind發(fā)布了一個(gè)新視頻，其中說到：

我們接下來(lái)要做一件大事（the next big thing），那意味著需要去嘗試很多人們認(rèn)為過于困難的事情。但我們一定要去嘗試一下。

現(xiàn)在看來(lái)，這個(gè)next big thing就是指AGI了。

論文地址：https://www.deepmind.com/publications/a-generalist-agent

責(zé)任編輯：張燕妮來(lái)源：量子位

人工智能 DeepMind

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<bdo id="tzppn"><listing id="tzppn"><nav id="tzppn"></nav></listing></bdo>

<tr id="tzppn"></tr>

<wbr id="tzppn"></wbr>

<abbr id="tzppn"></abbr>

<p id="tzppn"><menu id="tzppn"></menu></p>