迪士尼玩起強(qiáng)化學(xué)習(xí),新機(jī)器人有星球大戰(zhàn)那味了
迪士尼新機(jī)器人閃亮登場(chǎng)!
話不多說,先來看長啥樣——
一閃一閃的大眼睛、搖搖晃晃的腦袋、靈活擺動(dòng)的觸角,還有一雙小短腿。
走起路來屁顛屁顛,關(guān)鍵還很穩(wěn):
雖然是機(jī)器,但不得不說這神態(tài)很有“靈性”:
就在剛舉行完的國際機(jī)器人頂會(huì)IROS上,迪士尼研究所研究科學(xué)家Moritz B?cher帶領(lǐng)團(tuán)隊(duì)展示的這個(gè)新機(jī)器人,可謂萌翻全場(chǎng)。
雖然這個(gè)小家伙還沒有一個(gè)正式的名字,但它的表現(xiàn)足夠令人印象深刻。
和常見的雙足機(jī)器人最大的不同點(diǎn)在于,它不僅能夠在行走中保持動(dòng)態(tài)平衡,還能夠通過動(dòng)作表達(dá)出一些“情感”。
經(jīng)研究人員介紹,這主要是因?yàn)樵谟?xùn)練過程中使用了團(tuán)隊(duì)去年耗費(fèi)一年時(shí)間研發(fā)的強(qiáng)化學(xué)習(xí)系統(tǒng);并且還請(qǐng)了專業(yè)的動(dòng)畫師設(shè)計(jì)動(dòng)作,將動(dòng)畫角色用動(dòng)作表現(xiàn)情感的方式應(yīng)用到了機(jī)器人身上。
基于此,小家伙不再是一個(gè)冷冰冰的機(jī)器??梢韵胍姡艚o它裝一個(gè)GPT大腦,家里的狗子?!?/p>
瑞思拜,我是大學(xué)生,給我。
不少網(wǎng)友看到后聯(lián)想到了星球大戰(zhàn)中的角色:
另一波網(wǎng)友認(rèn)為小家伙如此“憨態(tài)可掬”,分明就是現(xiàn)實(shí)版瓦力(WALL-E,《機(jī)器人總動(dòng)員》中的角色):
更有網(wǎng)友直呼感覺“站在了機(jī)器人革命的風(fēng)口浪尖”:
這個(gè)小家伙走起路來為何如此平穩(wěn)?開發(fā)者具體是如何賦予其“情感”的?我們接著往下看。
在瑞士森林中“漫步”
搖頭晃腦還能平穩(wěn)運(yùn)動(dòng)的秘訣,在于頭部和腿部的設(shè)計(jì)。
其中,小家伙的頭部是一個(gè)四自由度的設(shè)計(jì),可實(shí)現(xiàn)上、下、左、右四個(gè)方向傾斜觀察:
而它的腿部更是增加到五自由度,具備髖關(guān)節(jié),因此它在行走時(shí)能夠保持動(dòng)態(tài)平衡。
偷襲推它,或是故意拖拽它腳下的地毯,它都能應(yīng)對(duì)自如:
挑戰(zhàn)更為復(fù)雜的地形,在瑞士野外森林中漫步也不在話下:
穩(wěn)重又不失風(fēng)情,走著走著,還能跳上一段:
據(jù)研究人員介紹,能做到這種效果,從概念提出到最終打磨成型,其實(shí)只用了不到一年的時(shí)間。
這還要得益于3D打印技術(shù),使用模塊化硬件和執(zhí)行器,大為提高了設(shè)計(jì)和迭代的速度。
再來說說賦予其“情感”。
其實(shí)這種讓機(jī)器人以有情感的方式運(yùn)動(dòng)是迪士尼的專長,早在上世紀(jì)六七十年代,迪士尼就開發(fā)出了機(jī)械人偶。
但隨著機(jī)器人變得愈加先進(jìn)和機(jī)動(dòng),設(shè)計(jì)出能夠與其兼容的情感行為變得具有挑戰(zhàn)性。
為此,迪士尼搬出了王牌,請(qǐng)用了擅長使角色通過運(yùn)動(dòng)傳達(dá)情感的動(dòng)畫師來為機(jī)器人設(shè)計(jì)動(dòng)作。
但交由動(dòng)畫師設(shè)計(jì)動(dòng)作,就不得不面臨一個(gè)難題——
動(dòng)畫工具通常沒有內(nèi)置物理特性,動(dòng)畫師的設(shè)想有時(shí)在現(xiàn)實(shí)中難以做到。這就使得團(tuán)隊(duì)需要耗費(fèi)大量時(shí)間試驗(yàn)。
為了彌合這一差距,團(tuán)隊(duì)用到了強(qiáng)化學(xué)習(xí)系統(tǒng)。
背后是強(qiáng)化學(xué)習(xí)的加持
研究團(tuán)隊(duì)開發(fā)了一個(gè)基于強(qiáng)化學(xué)習(xí)的流程,通過模擬將動(dòng)畫師的視覺設(shè)想和機(jī)器人動(dòng)作相結(jié)合。
這個(gè)過程本質(zhì)上是為動(dòng)畫師提供了物理約束條件,確保動(dòng)畫師設(shè)計(jì)的高表現(xiàn)力動(dòng)作可以在現(xiàn)實(shí)中實(shí)行,或者盡可能接近機(jī)器人所能做到的程度。
迪士尼研究所的研究科學(xué)家Morgan Pope表示:
這就不僅僅是走路了,走路只是強(qiáng)化學(xué)習(xí)系統(tǒng)的輸入之一,另一個(gè)重要的輸入是如何行走。
好在這種情況下,強(qiáng)化學(xué)習(xí)的一大優(yōu)勢(shì)是生成的運(yùn)動(dòng)魯棒性很好。
并且根據(jù)研究人員的說法,用該流程在一臺(tái)PC上只需幾個(gè)小時(shí)就能訓(xùn)練機(jī)器人做新動(dòng)作,大大縮短了開發(fā)新機(jī)器人角色所需的時(shí)間。
同時(shí)在一遍遍的訓(xùn)練中,還可以對(duì)電機(jī)性能、質(zhì)量分布和機(jī)器人與地面之間的摩擦力等進(jìn)行細(xì)微的調(diào)整。
團(tuán)隊(duì)負(fù)責(zé)人B?cher認(rèn)為,“這使得迪士尼開發(fā)新機(jī)器人角色所需的時(shí)間從幾年縮短到幾個(gè)月”。
并且研究人員還強(qiáng)調(diào)重要的不是機(jī)器人,而是這個(gè)過程:
所以如果我們想要增加更多的腿、手臂,或者制作一個(gè)全新角色,我們可以迅速教它新的動(dòng)作?,F(xiàn)成的執(zhí)行器、3D打印組件、可適應(yīng)性強(qiáng)的強(qiáng)化學(xué)習(xí)框架,這些都可以應(yīng)用于外觀和動(dòng)作都大不相同的機(jī)器人。
而這個(gè)機(jī)器人,只是該旅程的第一步。