偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

波士頓動力Atlas人形機器人再現(xiàn)逆天進化:通用AI機器人真的要來了

人工智能 新聞
波士頓動力已經(jīng)證明,可以訓(xùn)練出多任務(wù)、語言驅(qū)動的策略模型,來控制自家的 Atlas人形機器人完成那些既需要移動又需要靈巧全身操作的長期任務(wù)。

不是標(biāo)題黨,波士頓動力是真的很強,他們剛剛發(fā)布了一個視頻,直接硬控我了,這是我目前看到過最震撼的人形機器人,看視頻。

波士頓動力已經(jīng)證明,可以訓(xùn)練出多任務(wù)、語言驅(qū)動的策略模型,來控制自家的 Atlas人形機器人完成那些既需要移動又需要靈巧全身操作的長期任務(wù)。這種數(shù)據(jù)驅(qū)動的方法是通用的,幾乎可以應(yīng)用于任何能通過遙控操作演示的任務(wù)。

波士頓動力野心還是很大的,從一開始就想著構(gòu)建通用人形機器人,波士頓動力認為未來的通用人形機器人,需要掌握一長串復(fù)雜的技能。它們不僅要能靈巧地操作形態(tài)各異的物體(比如硬的/軟的、重的/輕的、剛性的/鉸接的、大的/小的),還需要協(xié)調(diào)整個身體來調(diào)整姿態(tài)、改造環(huán)境、躲避障礙,并在應(yīng)對突發(fā)狀況時保持平衡。要讓機器人掌握這些能力,并最終實現(xiàn)人形機器人的規(guī)?;瘧?yīng)用,構(gòu)建通用人工智能機器人是那條最可行的路。

這次波士頓動力為自家的Atlas人形機器人訓(xùn)練了一個全新的大型行為模型Large Behavior Models (LBMs)。

LBMs是一種端到端的、由語言指令驅(qū)動的策略模型,它能讓 Atlas 完成需要長遠規(guī)劃的復(fù)雜操作任務(wù)。

策略模型能夠充分利用人形機器人的獨特優(yōu)勢,包括:邁步行走、精準(zhǔn)落腳、彎腰下蹲、轉(zhuǎn)移重心、避免自我碰撞等等。研究發(fā)現(xiàn),所有這些能力對于解決真實世界里的移動操作任務(wù)都至關(guān)重要。

構(gòu)建策略模型的過程,主要包含四個基本步驟:

1. 通過遙控操作在真實機器人和仿真環(huán)境中,收集具身行為數(shù)據(jù)。

2. 處理、標(biāo)注和篩選這些數(shù)據(jù),使其能輕松地融入機器學(xué)習(xí)流程。

3. 使用所有任務(wù)收集到的全部數(shù)據(jù),來訓(xùn)練一個統(tǒng)一的神經(jīng)網(wǎng)絡(luò)策略模型。

4. 使用一套專門的測試任務(wù)來評估這個策略模型的表現(xiàn)。

第四步的評估結(jié)果,將指導(dǎo)后續(xù)的決策——比如還需要收集哪些額外數(shù)據(jù),或者應(yīng)該調(diào)整哪種網(wǎng)絡(luò)架構(gòu)或推理策略,才能進一步提升性能。

這個策略模型,能將圖像、本體感覺(proprioception)和語言提示等輸入信息,轉(zhuǎn)化為控制整個 Atlas 機器人以 30Hz 頻率活動的動作指令。研究人員采用了一種結(jié)合了流匹配損失(flow matching loss)的擴散型 Transformer(diffusion transformer)架構(gòu)來訓(xùn)練模型。

在整個實踐過程中,遵循了三大核心原則:

最大化任務(wù)覆蓋范圍: 理論上,人形機器人能處理的任務(wù)范圍極其廣泛。但要收集超越原地操作范疇的高質(zhì)量、高響應(yīng)度的動態(tài)數(shù)據(jù),是極具挑戰(zhàn)的。為此,研究人員打造了一套頂尖的遙操作系統(tǒng),它巧妙地結(jié)合了 Atlas 自身強大的模型預(yù)測控制器(Model Predictive Controller, MPC)和一套定制的 VR 交互界面,能夠完成從指尖級別的精細操作到全身參與的移動和抓取等各種任務(wù)。

訓(xùn)練通用策略模型: 業(yè)界已有越來越多的證據(jù)表明,在一個龐大且多樣化的任務(wù)數(shù)據(jù)集上訓(xùn)練出的通用策略模型,其泛化能力和恢復(fù)能力遠超那些只為解決一兩個特定任務(wù)而訓(xùn)練的專家模型。采用多任務(wù)、語言指令驅(qū)動的策略模型,讓它能勝任多種任務(wù),并且適配多種機器人形態(tài)。整合來自完整 Atlas 機器人、僅有上半身的 Atlas 操作測試臺以及豐田技術(shù)研究院的拉面機器人項目的數(shù)據(jù)。構(gòu)建通用策略模型不僅簡化了部署流程,還能讓不同任務(wù)和機器人形態(tài)之間共享模型的改進成果,離解鎖涌現(xiàn)能力更近一步。

構(gòu)建支持快速迭代和嚴(yán)謹(jǐn)科學(xué)研究的基礎(chǔ)設(shè)施: 能夠快速驗證設(shè)計方案至關(guān)重要,而能夠滿懷信心地衡量一個策略模型比另一個是好是壞,則是取得穩(wěn)步進展的關(guān)鍵。通過將仿真、硬件測試和生產(chǎn)級別的機器學(xué)習(xí)基礎(chǔ)設(shè)施相結(jié)合,研究人員得以高效地探索數(shù)據(jù)和策略模型的設(shè)計空間,并持續(xù)提升機器人在真實世界中的表現(xiàn)。

長遠規(guī)劃、端到端的操作能力

維修站這個任務(wù),完美展示了機器人如何協(xié)調(diào)運動與操作。它需要機器人完成踏步、開闊步站姿、下蹲等協(xié)調(diào)的移動,以及抓取零件、二次抓握、操控、放置和滑動等一系列靈巧的操作。整個任務(wù)包含三個子任務(wù):

1. 從推車上抓取 Spot 機器人的腿部零件,將它們折疊好,然后放到架子上。



2. 從推車上抓取面板,然后拉開底層架子上的一個箱子,并將面板放進去。



3. 當(dāng)推車被清空后,轉(zhuǎn)身面對身后的藍色箱子,將里面所有剩余的 Spot 零件,一把一把地抓取出來,并放入旁邊的藍色翻斗車中。

視頻一鏡到底,端到端,展示了由一個單一的、由語言驅(qū)動的策略模型來執(zhí)行這完整的一系列任務(wù)。操作員只需向模型發(fā)送高級語言指令,就能觸發(fā)每一個子任務(wù)。

這正是策略模型的一大亮點:能夠智能應(yīng)對意外情況,比如零件掉到地上,或是箱蓋突然合上了。最初版本的模型并不具備這些能力。但后來,研究人員向系統(tǒng)演示了機器人如何從這些干擾中恢復(fù),然后用這些新數(shù)據(jù)重新訓(xùn)練網(wǎng)絡(luò)。很快就部署了全新的、能夠靈活反應(yīng)的策略模型,整個過程無需任何算法或工程上的修改。這背后是強大的學(xué)習(xí)能力:策略模型能僅憑傳感器的輸入,有效地評估世界當(dāng)前的狀態(tài),并完全基于訓(xùn)練中學(xué)到的經(jīng)驗做出相應(yīng)的反應(yīng)。如此一來,為 Atlas 編寫新的操作行為,不再需要高深的學(xué)位和多年的經(jīng)驗積累。

更多令人驚嘆的操作能力

這次波士頓動力研究了數(shù)十個任務(wù),它們既是基準(zhǔn)測試,也一次次地拓展了我們對機器人操作能力的認知邊界。在 Atlas MTS 平臺上,用同一個語言驅(qū)動的策略模型,完成了從簡單的抓取-放置到更復(fù)雜的任務(wù),比如打繩結(jié)、翻轉(zhuǎn)吧臺凳、展開并鋪平桌布,以及搬運一個重達 22 磅(約 10 公斤)的汽車輪胎。像繩索、布料和輪胎這類物體,由于其易變形的幾何特性和復(fù)雜的操作順序,用傳統(tǒng)的機器人編程技術(shù)來處理會極其困難。但對于大型行為模型(LBMs)來說,無論是堆疊剛性積木還是折疊 T 恤,訓(xùn)練過程都是一樣的:只要你能演示一遍,機器人就能學(xué)會。

學(xué)習(xí)之后:自適應(yīng)調(diào)整性能

策略模型還有一個顯著的特點是,可以在模型推理時,隨時加快執(zhí)行速度,而無需重新訓(xùn)練。具體來說,由于模型會預(yù)測一連串未來動作以及這些動作應(yīng)該發(fā)生的時間點,就可以通過調(diào)整這個時間軸來控制執(zhí)行速度。在下面的視頻中,對比了模型以 1 倍速(即數(shù)據(jù)采集時的原始速度)、2 倍速和 3 倍速執(zhí)行任務(wù)的效果??偟膩碚f,研究發(fā)現(xiàn),無論是在 MTS 平臺上還是在完整的 Atlas 機器人上,將策略模型的執(zhí)行速度提升 1.5 到 2 倍,都不會顯著影響其性能。雖然任務(wù)本身的物理特性有時會限制這種推理時的加速,但這確實表明,在某些情況下,甚至可以超越人類遙操作的速度極限。

方法

平臺

Atlas 機器人擁有 50 個自由度(Degrees of Freedom, DoF),這為它提供了廣闊的運動范圍和高度的靈活性;而 Atlas MTS 則擁有 29 個自由度,專注于純粹的操作任務(wù)研究。每個夾爪都有 7 個自由度,能夠運用多種抓握策略(如強力抓握、捏式抓握等)。依靠安裝在頭部的一對 HDR 立體攝像頭,為遙操作提供環(huán)境感知,同時也為策略模型提供視覺輸入。

遙控操作:為模型訓(xùn)練收集高質(zhì)量數(shù)據(jù)

要讓機器人以流暢、動態(tài)且靈巧的方式運動,一套頂級的遙操作系統(tǒng)至關(guān)重要,為此研究投入了大量精力。該系統(tǒng)構(gòu)建于波士頓動力成熟的 MPC 系統(tǒng)之上,該系統(tǒng)曾被用于從跑酷、跳舞到各種實用與非實用的操作任務(wù)中。這套控制系統(tǒng)能夠在精確操作的同時保持平衡、避免自我碰撞,不斷挑戰(zhàn) Atlas 硬件的極限。

遙操作裝置利用 VR 頭顯,讓操作員完全沉浸在機器人的工作空間中,并能獲取與策略模型完全相同的信息。通過 Atlas 頭部的攝像頭,立體視覺畫面被重新投影到用戶的視角,增強了空間感知能力。定制的 VR 軟件為遙操作員提供了一個信息豐富的界面,通過增強現(xiàn)實、控制器觸覺反饋和抬頭顯示元素,實時展示機器人狀態(tài)、控制目標(biāo)、傳感器讀數(shù)和系統(tǒng)狀態(tài)。這使得操作員能夠充分利用機器人的硬件和能力,讓自己的身體和感官與機器人同步。

最初版本的 VR 遙操作應(yīng)用,操作員只需站著不動,通過頭顯、基站、控制器和一個胸部追蹤器來控制 Atlas。這個系統(tǒng)采用了一對一的映射關(guān)系(例如,你的手移動 1 厘米,機器人的手也移動 1 厘米),帶來了非常直觀的控制體驗,尤其適合雙手協(xié)作任務(wù)。即使是這個版本,操作員也已經(jīng)能完成各種任務(wù),比如蹲下?lián)炱鸬厣系奈矬w,或者站直去夠高處架子上的東西。然而,這個系統(tǒng)的一個局限是無法讓操作員動態(tài)地重新定位機器人的腳或讓它邁步,這極大地限制了能執(zhí)行的任務(wù)類型。

為了支持移動操作,研究人員為雙腳增加了兩個額外的追蹤器,實現(xiàn)了腳部的一對一追蹤,并擴展了遙操作控制邏輯,使得 Atlas 的站姿模式、支撐區(qū)域和行走意圖都能與操作員保持一致。除了支持移動,這套裝置還讓我們能充分利用 Atlas 的整個工作空間。例如,當(dāng)打開地上的藍色手提箱并從中取物時,操作員必須能讓機器人以寬闊的站姿和彎曲的膝蓋來夠到箱內(nèi)的物體,同時避免與箱子發(fā)生碰撞。

神經(jīng)網(wǎng)絡(luò)策略模型,使用了與遙操作員完全相同的機器人控制接口??梢暂p松復(fù)用之前為無移動任務(wù)開發(fā)的模型架構(gòu),只需簡單地擴展動作的表示方式即可。

策略模型本體

策略模型建立在大型行為模型(Large Behavior Models)研究之上,該研究擴展了類似 Diffusion Policy 的架構(gòu)。采用了一個擁有 4.5 億參數(shù)的、基于擴散型 Transformer 的架構(gòu),并結(jié)合了流匹配(flow-matching)目標(biāo)進行訓(xùn)練。該模型不僅接收本體感覺信息和圖像,還能接受指定機器人目標(biāo)的語言提示。圖像數(shù)據(jù)以 30 Hz 的頻率輸入,網(wǎng)絡(luò)會利用一段歷史觀測數(shù)據(jù)來預(yù)測一個包含 48 個動作的動作塊(action-chunk),這對應(yīng)著 1.6 秒的動作序列。在實際運行時(1 倍速下),每次策略模型推理后會執(zhí)行其中的 24 個動作(即 0.8 秒的動作)。

Atlas 的觀測空間包括來自其頭部攝像頭拍攝的圖像和本體感覺信息。其動作空間則包括左右夾爪的關(guān)節(jié)位置、頸部偏航、軀干姿態(tài)、左右手姿態(tài)以及左右腳的姿態(tài)。

Atlas MTS 在機械和軟件層面都與 Atlas 的上半身完全相同。它的觀測和動作空間也與 Atlas 一致,只是省略了軀干和下半身的部分。這種跨 Atlas 和 Atlas MTS 的共享硬件與軟件設(shè)計,有助于訓(xùn)練能夠同時在兩個平臺上運行的多機器人形態(tài)策略模型,能匯集來自兩種機器人的數(shù)據(jù)。

這些策略模型所用的數(shù)據(jù),由團隊持續(xù)不斷地收集和迭代而來。高質(zhì)量的演示數(shù)據(jù)是獲得成功模型的關(guān)鍵。研究高度依賴質(zhì)量保證工具,它能幫助審查、篩選收集到的數(shù)據(jù)并提供反饋。

仿真

仿真是快速迭代的關(guān)鍵工具。它能迅速迭代遙操作系統(tǒng)、編寫單元測試和集成測試以確保系統(tǒng)穩(wěn)定,并進行那些在真實硬件上會更慢、更昂貴且難以重復(fù)的信息化訓(xùn)練和評估。由于仿真技術(shù)棧是硬件和機器人端軟件的忠實復(fù)現(xiàn),研究得以在仿真和硬件平臺之間共享數(shù)據(jù)管道、可視化工具、訓(xùn)練代碼、VR 軟件和接口。

除了使用仿真來評估策略模型和架構(gòu)選擇,研究還把仿真作為一個重要的聯(lián)合訓(xùn)練數(shù)據(jù)來源,用于部署在硬件上的多任務(wù)、多機器人形態(tài)的策略模型。

責(zé)任編輯:張燕妮 來源: AI寒武紀(jì)
相關(guān)推薦

2024-04-18 13:17:15

人形機器人

2024-04-19 09:24:24

機器人波士頓

2019-09-25 09:53:45

機器人人工智能系統(tǒng)

2021-05-24 10:39:36

波士頓機器人人工智能

2024-01-22 09:03:00

機器人

2021-08-25 14:06:57

機器人人工智能波士頓

2017-10-18 08:49:09

機器人

2020-03-04 15:10:16

機器人人工智能系統(tǒng)

2021-03-30 12:59:06

波士頓機器人人工智能

2020-02-18 10:26:58

機器人人工智能系統(tǒng)

2024-09-18 08:42:00

2022-01-20 14:20:23

機器人人工智能AI

2024-04-18 11:57:06

模型訓(xùn)練

2023-12-28 17:17:20

智能模型

2019-12-03 09:27:03

機器人人工智能系統(tǒng)

2025-08-22 15:14:27

2024-09-26 14:54:31

2025-02-25 10:32:10

2024-02-06 12:49:48

AI模型
點贊
收藏

51CTO技術(shù)棧公眾號