偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

機器人邁向ChatGPT時刻!清華團隊首次發(fā)現(xiàn)具身智能Scaling Laws

人工智能 新聞
他們發(fā)現(xiàn)了具身智能領域的 “圣杯”——data scaling laws,讓機器人實現(xiàn)了真正的零樣本泛化,可以無需任何微調就能泛化到全新的場景和物體。

想象這樣一個場景:你正在火鍋店和朋友暢聊,一個機器人熟練地為你倒飲料、端菜,完全不需要你分心招呼服務員。這個聽起來像科幻的場景,已經(jīng)被清華大學交叉信息院的研究者們變成了現(xiàn)實!他們發(fā)現(xiàn)了具身智能領域的 “圣杯”——data scaling laws,讓機器人實現(xiàn)了真正的零樣本泛化,可以無需任何微調就能泛化到全新的場景和物體。這一突破性發(fā)現(xiàn),很可能成為機器人領域的 “ChatGPT 時刻”,徹底改變我們開發(fā)通用機器人的方式!

從火鍋店到電梯,機器人展現(xiàn)驚人泛化力

研究團隊可不是只在實驗室里玩玩具。他們把機器人帶到了各種真實場景:火鍋店、咖啡廳、公園、噴泉旁,甚至是電梯里。更令人震驚的是,機器人在這些前所未見的環(huán)境中都展現(xiàn)出了超強的適應能力!

為了確保研究的可復現(xiàn)性,團隊慷慨地開源了所有資源,包括耗時半年收集的海量人類演示數(shù)據(jù):

圖片

  • 論文標題:Data Scaling Laws in Imitation Learning for Robotic Manipulation
  • 論文鏈接:https://arxiv.org/abs/2410.18647
  • 項目主頁:https://data-scaling-laws.github.io/

連 Google DeepMind 的機器人專家 Ted Xiao 都忍不住為這項研究點贊,稱其對機器人大模型時代具有里程碑意義!

圖片

Scaling Laws:從 ChatGPT 到機器人的制勝法則

還記得 ChatGPT 為什么能橫空出世嗎?答案就是 scaling laws!現(xiàn)在,清華團隊首次證明:這個法則在機器人領域同樣適用。事實上,真正的 scaling laws 包含數(shù)據(jù)、模型和算力三個維度,而本研究重點突破了最基礎也最關鍵的數(shù)據(jù)維度。

研究團隊使用便攜式手持夾爪 UMI,在真實環(huán)境中收集了超過 4 萬條人類演示數(shù)據(jù)。他們采用最新的 Diffusion Policy 方法從這些數(shù)據(jù)中學習機器人控制模型,并通過驚人的 15000 + 次實機測試進行嚴謹評估,最終發(fā)現(xiàn)了三個革命性的冪律關系:

  • 模型對新物體的泛化能力與訓練「物體」數(shù)量呈冪律關系。
  • 模型對新環(huán)境的泛化能力與訓練「環(huán)境」數(shù)量呈冪律關系。
  • 模型對環(huán)境 - 物體組合的泛化能力與訓練「環(huán)境 - 物體對」的數(shù)量呈冪律關系。

圖片

這意味著什么?簡單說:只要有足夠的數(shù)據(jù),機器人就能像 ChatGPT 理解語言一樣,自然地理解和適應物理世界!這一發(fā)現(xiàn)不僅證實了機器人領域與語言模型存在驚人的相似性,更為預測數(shù)據(jù)規(guī)模與模型性能的關系提供了堅實的理論基礎。

顛覆性發(fā)現(xiàn):數(shù)據(jù)收集原來要這么做!

研究團隊還破解了一個困擾業(yè)界的難題:對于給定的操作任務,如何優(yōu)化選擇環(huán)境數(shù)量、物體數(shù)量和每個物體的演示次數(shù)?

經(jīng)過大量實驗,他們得出了兩個出人意料的結論:

1. 當環(huán)境數(shù)量足夠多時,在單一環(huán)境中收集多個不同的操作物體的數(shù)據(jù)收益極其有限 —— 換句話說,每個環(huán)境只需要一個操作物體的數(shù)據(jù)就夠了。

圖片

2. 單個物體的演示數(shù)據(jù)很容易達到飽和 —— 在倒水和擺放鼠標等任務中,總演示數(shù)據(jù)達到 800 次時,性能就開始趨于穩(wěn)定。因此,每個物體 50 次示范基本就能搞定。

圖片

為驗證這個策略,團隊找來 4 個人,只花了一個下午就收集到了訓練數(shù)據(jù)。結果令人震驚:在 8 個全新場景中,機器人成功率高達 90%!這意味著,原本可能需要幾個月的數(shù)據(jù)收集工作,現(xiàn)在可能只需要幾天就能完成!

圖片

模型規(guī)?;剿鞯囊馔獍l(fā)現(xiàn)

除了數(shù)據(jù)規(guī)模,研究團隊還在模型規(guī)?;矫嬗腥齻€重要發(fā)現(xiàn):

  • 視覺編碼器必須經(jīng)過預訓練和完整的微調,缺一不可
  • 擴大視覺編碼器的規(guī)模能顯著提升性能
  • 最令人意外的是:擴大擴散模型的規(guī)模卻沒能帶來明顯的性能提升,這一現(xiàn)象還值得深入研究

圖片

未來展望

數(shù)據(jù)規(guī)?;谕苿訖C器人技術走向新紀元。但研究團隊提醒:比起盲目增加數(shù)據(jù)量,提升數(shù)據(jù)質量可能更為重要。關鍵問題在于:

  • 如何確定真正需要擴展的數(shù)據(jù)類型?
  • 如何最高效地獲取這些高質量數(shù)據(jù)?

這些都是 Data Scaling Laws 研究正在積極探索的方向。相信在不久的將來,具有超強適應力的機器人將走進千家萬戶,讓科幻電影中的場景變?yōu)楝F(xiàn)實!而這一切,都將從清華團隊發(fā)現(xiàn)的這個基礎性規(guī)律開始!

關于作者

該項目有兩位共同一作。一位是清華大學交叉信息研究院四年級博士生胡英東,專注于具身智能領域的前沿研究。他致力于探索通用機器人系統(tǒng)所面臨的基礎性問題,旨在使機器人能夠在各種非結構化的現(xiàn)實環(huán)境中泛化其學習到的行為。

圖片

另一位是交叉信息研究院一年級博士生林凡淇。他專注于將大模型的先驗知識融合到機器人任務中,幫助機器人完成日常生活中的復雜任務;同時他希望利用已有的機器人算法、視覺語言大模型,探索機器人落地的可能性。

圖片

項目的通訊作者是清華大學交叉信息研究院的助理教授高陽,他主要研究計算機視覺與機器人學。此前,他在美國加州大學伯克利分校獲得博士學位,師從 Trevor Darrell 教授。他還在加州伯克利大學與 Pieter Abbeel 等人合作完成了博士后工作。在此之前,高陽從清華大學計算機系畢業(yè),與朱軍教授在貝葉斯推理方面開展了研究工作。他在 2011-2012 年在谷歌研究院進行了自然語言處理相關的研究工作、2016 年在谷歌自動駕駛部門 Waymo 的相機感知團隊工作,在 2018 年與 Vladlen Koltun 博士在英特爾研究院在端到端自動駕駛方面進行了研究工作。高陽在人工智能頂級會議 NeurIPS,ICML,CVPR,ECCV,ICLR 等發(fā)表過多篇學術論文,谷歌學術引用量超過 2000 次。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-11-11 14:00:00

AI模型

2025-09-24 11:24:42

2024-12-19 14:44:22

2023-11-08 13:20:00

模型數(shù)據(jù)

2024-07-22 08:00:00

機器人虛擬

2025-08-13 09:07:00

2023-10-04 11:54:34

2024-11-07 14:35:45

2025-05-28 13:25:14

2025-05-12 09:02:00

2023-12-23 23:16:36

機器人模型

2024-09-18 13:30:00

2024-07-04 10:16:26

點贊
收藏

51CTO技術棧公眾號