想讓機(jī)器人跑得更快,讓人工智能來控制
四足機(jī)器人對于大家來說應(yīng)該已經(jīng)不再陌生,盡管大多數(shù)人還只能從媒體或者企業(yè)的演示視頻中看到它們的身影,但我們相信它們已經(jīng)從科幻電影的屏幕中走了出來。當(dāng)然那些機(jī)器人工程師們?nèi)栽谘芯咳绾巫屵@些機(jī)器擁有更多的功能,讓它們真正走入人們生活中。
現(xiàn)在,麻省理工學(xué)院(MIT)的一組研究人員表示,改善機(jī)器人功能的一種方法可能是使用人工智能幫助教機(jī)器人如何走路和跑步。
以往,當(dāng)工程師們在開發(fā)控制有腿機(jī)器人運(yùn)動的軟件時(shí),他們會編寫一套規(guī)則,規(guī)定機(jī)器應(yīng)該如何響應(yīng)特定的輸入。因此,如果機(jī)器人的傳感器檢測到y(tǒng)腿上有x個(gè)力,它就會通過給電機(jī)a供電來施加力矩b,以此類推。對這些參數(shù)進(jìn)行編碼既復(fù)雜又耗時(shí),但它可以讓研究人員對機(jī)器人進(jìn)行精確和可預(yù)測的控制。
另一種方法是使用機(jī)器學(xué)習(xí)(ML)——更進(jìn)一步來說,這種方法被稱為強(qiáng)化學(xué)習(xí)(RL),通過反復(fù)試驗(yàn)來發(fā)揮作用。通過給你的AI模型一個(gè)稱為“獎勵(lì)功能”的目標(biāo)(例如,盡可能快地移動),然后讓它自行想出如何從零開始實(shí)現(xiàn)這個(gè)結(jié)果。這需要很長時(shí)間,但可以讓AI在虛擬環(huán)境中進(jìn)行實(shí)驗(yàn),就可以加快時(shí)間。這就是為什么強(qiáng)化學(xué)習(xí)是開發(fā)電子游戲中人工智能的流行方式。
MIT的工程師們就是使用這種技術(shù),他們?yōu)樽约旱乃淖銠C(jī)器人研究項(xiàng)目“迷你獵豹”(Mini Cheetah)開發(fā)了一種新的控制軟件。通過強(qiáng)化學(xué)習(xí),他們能夠?yàn)闄C(jī)器人實(shí)現(xiàn)3.9米/秒的最高速度,達(dá)到大約14公里/小時(shí)。
迷你獵豹跑步的步態(tài)有點(diǎn)笨拙。事實(shí)上,它看起來就像一只小狗在木地板上抓來抓去的加速。但是工程師認(rèn)為,這是因?yàn)槿斯ぶ悄艹怂俣戎鉀]有優(yōu)化任何其他東西。
深度學(xué)習(xí)找到了一種跑得快的方法,但由于其獎勵(lì)功能不明確,它沒有理由選擇一種“看起來自然”或人類喜歡的步態(tài)。這個(gè)模型當(dāng)然可以用來指導(dǎo)開發(fā)一種更流暢(真實(shí))的運(yùn)動形式,但目前整個(gè)努力的重點(diǎn)只在優(yōu)化速度。
使用人工智能開發(fā)控制器軟件的一個(gè)很大的優(yōu)勢是,減少了浪費(fèi)在物理上的時(shí)間。人工編程讓機(jī)器人在各種可能的情況下如何行動是非常困難的,而且這個(gè)過程很繁瑣,如果機(jī)器人在特定的地形上發(fā)生故障,人類工程師就需要確定故障的原因,并手動調(diào)整機(jī)器人控制器。
通過使用模擬器,工程師可以將機(jī)器人置于任何的虛擬環(huán)境中——從堅(jiān)實(shí)的路面到光滑的碎石——并讓它自己解決問題。事實(shí)上,麻省理工學(xué)院的研究小組表示,他們的模擬器能夠在3個(gè)小時(shí)內(nèi)快速完成以往需要100天的蹣跚行走和跑步。
一些研發(fā)有腿機(jī)器人的公司已經(jīng)在使用這些方法來設(shè)計(jì)新的控制器。不過,以知名的波士頓動力公司(Boston Dynamics)為代表的一些公司仍然依賴更傳統(tǒng)的方法。因?yàn)樵摴緦﹂_發(fā)非常具體而精準(zhǔn)的動作感興趣,比如在其精心編排的視頻中可以看到雙足或四足機(jī)器人進(jìn)行各種跳躍、翻轉(zhuǎn)、跨越障礙甚至舞蹈動作。
目前,波士頓動力公司的“獵豹”機(jī)器人保持著四足機(jī)器人的最高時(shí)速紀(jì)錄,達(dá)到45.5公里/小時(shí),比博爾特還快。然而,獵豹的紀(jì)錄也許很快會被超越。畢竟它不僅比麻省理工學(xué)院的迷你獵豹更大,而且這個(gè)紀(jì)錄還是在跑步機(jī)上實(shí)現(xiàn)的,同時(shí)安裝了一個(gè)杠桿以保持穩(wěn)定性。如果沒有這些優(yōu)勢,人工智能驅(qū)動下的“小獵豹”也許會很快追上來。