四足機器人學(xué)會“雙腿站立下樓梯”!效率比腿式系統(tǒng)高83%
?還記得那個和特斯拉飆車的機器人嗎?

這是瑞士蘇黎世聯(lián)邦理工學(xué)院衍生公司研發(fā)的與公司同名的四足輪腿式機器人——Swiss-Mile,前身是ANYmal四足機器人。

距離它和特斯拉飆車還不到半年的時間,它又實現(xiàn)了重大升級。

這次升級改進了機器人的算法,運動能力直接UP UP UP !
可以雙腿站立下樓梯:

(小編內(nèi)心OS:如果是我穿輪滑鞋下樓梯可能會摔個狗吃屎)
樓梯爬累了,坐個電梯吧,用前腳按開電梯門:

面對障礙物應(yīng)對自如:

它還能知道什么時候該站起來,什么時候該“趴下”,雙腿直立與四足運動之間的切換更絲滑:

AMP 算法首次應(yīng)用在真實機器人上
Swiss-Mile之前使用過模型預(yù)測控制(MPC)與強化學(xué)習(xí)(RL)方法,然而這需要進行繁瑣的調(diào)整才能獲得理想的運動方式。

這次的算法升級,研究人員采用了Multi-AMP(Adversarial Motion Priors對抗性運動先驗)算法增強了傳統(tǒng)的強化學(xué)習(xí)框架,可以在沒有啟發(fā)式的情況下自動執(zhí)行多個運動先驗的模仿?標(biāo)和運動選擇過程。

AMP究竟是什么呢?
這是一種基于物理角色動畫的對抗學(xué)習(xí)系統(tǒng),由加州?學(xué)伯克利分校和上海交通大學(xué)的研究者提出,并且Swiss-Mile首次將該方法應(yīng)用于真正的機器人身上!

對于一般的模仿學(xué)習(xí),通常需要手動提取大量需要模仿的運動片段作為跟蹤目標(biāo),而使用AMP能夠自動選合適的動作片段來實現(xiàn)目標(biāo)任務(wù),它將誤差度量、相位和運動剪輯選擇外包給鑒別器,鑒別器學(xué)習(xí)區(qū)分策略和運動數(shù)據(jù)的狀態(tài)轉(zhuǎn)換。

模擬和部署訓(xùn)練
研究人員將Multi-AMP 框架部署在具有 16個自由度的Swiss-Mile上,使? Isaac Gym 模擬器實現(xiàn),超過 4000個機器人可以同時在 42 分鐘內(nèi)訓(xùn)練技能。

訓(xùn)練環(huán)境由三個任務(wù)組成:
第?個任務(wù)是四足運動,運動數(shù)據(jù)由RL 策略記錄的運動組成。

第二個任務(wù)是躲避技能,讓機器?躲到桌?下?。該技能的運動數(shù)據(jù)由軌跡優(yōu)化管道?成,由 MPC 控制器部署和跟蹤。

最后?項任務(wù)是“站立”到“四足”之間的運動轉(zhuǎn)換,機器人運用數(shù)據(jù)解耦技能可以用后腿站起來,?兩條腿滑行,最后使用與站起來時的相同的動作再次坐下。

最后,將Swiss-Mile部署到真實環(huán)境中,研究人員使用腿部關(guān)節(jié)的執(zhí)行器模型來彌合模擬到真實的差距,并利用崎嶇地形訓(xùn)練、隨機干擾等提高穩(wěn)健性;如果某個關(guān)節(jié)速度超過了執(zhí)行器的限制,則通過終?軌跡,讓機器人學(xué)會保持該限制的安全容差。

四足or人形機器人?效率比腿式系統(tǒng)高83%!
Swiss-Mile不僅是四足機器人,也是個人形機器人。
輪式與腿式相比具有許多顯著優(yōu)勢,在進行了算法改良后,機器人可以直接以“人形機器人”的狀態(tài)站立起來,執(zhí)行滑行、爬樓梯、下坡等高難度動作,能夠更快、更有效地移動,比四足行走要快的多,效率比腿式系統(tǒng)高 83%!

未來,該公司希望將輪腿機器人商業(yè)化,以完成各種任務(wù),包括地圖、檢查、救災(zāi)和城市環(huán)境中的物流等。
也許有一天,你會看到機器人將抬起來的“前腿”作為手臂,抓取快遞包裹,然后將它們放在背上的貨艙中,再回到四肢著地,以最快的速度送貨上門。?


































