DeepMind開源了MuJoCo!Meta竟用來讓「骷髏手」盤核桃
骷髏手「盤核桃」見過沒?
這個神奇的「手」來自Meta剛剛發(fā)布的AI平臺MyoSuite。
嗯……終結(jié)者的即視感有了。
小扎:元宇宙的「阿凡達」們有救了
傳統(tǒng)行業(yè)中流行著這么一句話,「一流企業(yè)做標準,二流企業(yè)做品牌,三流企業(yè)做產(chǎn)品」
雖然這話有點絕對,很多參與制定行業(yè)標準的一流企業(yè),品牌和產(chǎn)品更是一流的,但這句話的背后主要凸顯的是「標準」對于一個行業(yè)有多重要。
誰掌握了標準,誰就有了制定游戲規(guī)則的話語權(quán),誰就有在業(yè)內(nèi)「坐莊」的潛力。
來到AI時代,科技巨頭們同樣在爭奪「標準」這個業(yè)務(wù)高地,只不過換了不少新的名字,比如框架、平臺、基準,多少都帶了點業(yè)界標準的意思。
Meta自然也不例外。
當然,按照小扎All in元宇宙而不惜改名的這波操作,萬事皆可元宇宙。
我們可以訓(xùn)練模型來完成復(fù)雜的動作,如轉(zhuǎn)筆或轉(zhuǎn)鑰匙。這項研究不僅可以加速假肢、身體康復(fù)和手術(shù)技術(shù)的發(fā)展,而且還有助于我們?yōu)樵钪骈_發(fā)出更真實的化身。我們將開放這些模型的源代碼,以便研究人員可以使用它們來進一步推動這一領(lǐng)域。
好吧,沒想到,下面展示的竟然是轉(zhuǎn)筆,不是「抓罐子」……
但,這確實有點太粗了吧!
對了,還有轉(zhuǎn)鑰匙。(已經(jīng)習慣了,不必再吐槽了)
言歸正傳,雖然目前看起來模型似乎還處在一個初期階段,但是各種細節(jié)的控制已經(jīng)相當完善了。
滑動控制條伸出大拇指,然后再依次收回剩下四指,最后轉(zhuǎn)動胳膊……
來,給你豎個大拇指!
除此之外,如果研究能有進一步進展的話,確實可以讓Meta的「阿凡達」們擁有一套解剖學(xué)上正確的骨骼和動作,而不只是單純的可愛卡通形象。
神經(jīng)和運動智能的「大一統(tǒng)」
生物體越聰明,所表現(xiàn)出來的運動行為就越復(fù)雜。
因此,需要考慮的一個重要問題是:是什么促成了這種復(fù)雜決策以及執(zhí)行這些決策的運動控制?
Meta認為,開發(fā)MyoSuite就是為了探索這個問題。
論文地址:https://drive.google.com/file/d/10Le1OmOpy-Veb7n41ywrYLxyipoGfHtt/view
MyoSuite提供了一套肌肉骨骼模型和任務(wù)套件,用機器學(xué)習來解決生物力學(xué)控制問題。
Meta表示,MyoSuite另一個重要意義是統(tǒng)一了智能的兩個方面:運動智能和神經(jīng)智能,并為機器學(xué)習社區(qū)開源一套全面的基準。
人類的生物力學(xué)是一個復(fù)雜的多關(guān)節(jié)、多執(zhí)行器的肌肉骨骼系統(tǒng)。一塊肌肉的收縮涉及到多個關(guān)節(jié)的彎曲運動,每個關(guān)節(jié)的運動都由多塊肌肉控制。
在如此復(fù)雜的系統(tǒng)中,智能行為的合成和表達需要中樞神經(jīng)系統(tǒng)和外周肌肉骨骼系統(tǒng)之間的有效協(xié)調(diào),前者是由數(shù)十億個神經(jīng)元組成的網(wǎng)絡(luò)合成決策,后者則是將這些意圖轉(zhuǎn)化為行動。
MyoSuite是通過對現(xiàn)有模型和功能研究的深入研究而開發(fā)的,其研發(fā)基礎(chǔ)是手臂和手的OpenSim模型,目前已經(jīng)廣泛用于人類神經(jīng)機械控制、人機交互和康復(fù)等領(lǐng)域。
為了在MuJoCo中實現(xiàn)這些模型,研究人員開發(fā)了一個流程開發(fā)新的模型,來進行骨骼和肌肉附著的幾何變換、臂力矩優(yōu)化和肌力優(yōu)化。
MyoSuite提供了一個測試幾個生理上精確的肌肉骨骼模型的組合,具體的模型構(gòu)建可分為三步:
1. 幾何圖形轉(zhuǎn)換。包括關(guān)節(jié)的幾何形狀、肌肉附著點和包裹面的轉(zhuǎn)換。這個步驟是在之前工作的基礎(chǔ)上進行的。
2. 動力臂優(yōu)化。優(yōu)化MuJoCo中包裹面的三維位置。MuJoCo中包覆面的三維位置,以便實現(xiàn)與參考OpenSim模型相匹配的力矩臂。
3.肌肉力量優(yōu)化:對MuJoCo中的肌肉參數(shù)進行優(yōu)化,以實現(xiàn)與對照OpenSim模型相匹配的肌肉發(fā)力。經(jīng)過嚴格的建模和驗證,最終建立了三個復(fù)雜程度不同的模型。
MyoSuite中包含的肌肉骨骼模型。A:MyoFinger(4個關(guān)節(jié)、5塊肌肉),B:MyoElbow:(1個關(guān)節(jié)、6塊肌肉)。C:MyoHand(23個關(guān)節(jié)、39塊肌肉)。
手指(MyoFinger): 首先建立一個簡化和直觀的模型,即一個4自由度(DoF)的手指(MyoFinger,上圖A),它是通過一系列簡化的5個拮抗性肌肉-肌腱單元來驅(qū)動的。研究團隊為其提供了簡單的扭矩驅(qū)動器,以方便比較研究。
手肘(MyoElbow):一個1自由度人類肘關(guān)節(jié)的模型,基于OpenSim的默認設(shè)置測試手臂模型,并使用多個激動劑/拮抗劑對(3個屈肌和3個伸?。┻M行驅(qū)動(上圖B)。
手(MyoHand):實際上包括前臂、手腕和手。靈巧的人手需要協(xié)調(diào)多塊高度冗余的肌肉,這些肌肉對各種關(guān)節(jié)具有互補和拮抗作用。這個更復(fù)雜的肌肉骨骼模型由29塊骨頭,23個關(guān)節(jié),39個肌肉-肌腱單元組成(上圖C)。
多年來,人工智能領(lǐng)域一直試圖通過神經(jīng)結(jié)構(gòu)或神經(jīng)網(wǎng)絡(luò)來模仿智能行為。而在生物力學(xué)界,主要是獨立通過體內(nèi)和體外研究來開發(fā)肌肉骨骼系統(tǒng),以了解外周的驅(qū)動力。
有了MyoSuite,研究人員有望在感覺-運動控制的細節(jié)上取得更大進展,依靠不同的本體感覺信號來協(xié)調(diào)全身的運動控制,這是在豐富的互動環(huán)境中表現(xiàn)出智能行為所需要的。
MyoSuite的生理學(xué)上真實的肌肉骨骼模型,比現(xiàn)有模型的計算效率和可擴展性要高出4000倍。
有了這么強大的資源和計算效率做支撐,什么轉(zhuǎn)筆、轉(zhuǎn)鑰匙、單手盤核桃等自然不在話下了。
而且,這些「花活」就是為了告訴你MyoSuite「能干什么」,未來「要干什么」,Meta也說了,主要是運動康復(fù)、假肢開發(fā)和人體工程學(xué)應(yīng)用。
說不定以后的假肢,比原裝的還好用?
MuJoCo開源
說起來,從AlphaGo到MuZero,過去機器學(xué)習算法解決的復(fù)雜問題實在是不少,但在復(fù)雜運動控制的方向上一直應(yīng)用不多,Meta認為,主要原因是缺乏與外界復(fù)雜環(huán)境的互動能力。
換句話說,現(xiàn)有框架既沒有嵌入復(fù)雜而熟練的運動任務(wù),也沒有足夠的計算效率或可擴展性來滿足機器學(xué)習算法的數(shù)據(jù)需求。
Meta表示,MyoSuite有望彌補這些差距。
目前,MyoSuite已經(jīng)在MacOs和Linux上用MuJoCo v2.1.0進行了測試。
正巧的是,DeepMind也在同日對MuJoCo進行了開源。
項目地址:https://github.com/deepmind/mujoco
MuJoCo最初由華盛頓大學(xué)運動控制實驗室主任、神經(jīng)科學(xué)家Emo Todorov開發(fā),于2015年通過創(chuàng)業(yè)公司Robi LLC, 被打造成了商業(yè)產(chǎn)品。
2021年10月,DeepMind宣布收購MuJoCo物理模擬器,并承諾將MuJoCo作為一個免費的、開源的、社區(qū)驅(qū)動的項目進行開發(fā)和維護。
對于現(xiàn)在的機器人研究來說,物理模擬器是其中的關(guān)鍵性工具。其通??梢苑譃樯虡I(yè)的閉源軟件,和學(xué)術(shù)界的開源軟件。
第一類對用戶來說是不透明的,雖然有時可以免費使用,但不能修改,也很難理解。第二類通常有較小的用戶群,當其開發(fā)者和維護者畢業(yè)時,就會受到影響。
MuJoCo是為數(shù)不多的由一個成熟的公司支持的全功能模擬器之一,它是真正的開源代碼。
作為一個研究驅(qū)動的組織,DeepMind將MuJoCo視為一個合作的平臺,機器人學(xué)家和工程師可以加入我們,開發(fā)世界上最好的機器人模擬器之一。
目前,DeepMind的開源工作已經(jīng)完成,MuJoCo的整個代碼庫都已經(jīng)上傳至在GitHub了。