ICRA 2025|通用多機(jī)器人長(zhǎng)時(shí)任務(wù)規(guī)劃框架破解任務(wù)分配難題,成功率+105%、效率+36%
2025 年 5 月,美國(guó)加州大學(xué)河濱分校 (UC Riverside) 與賓夕法尼亞州立大學(xué) (Penn State University) 聯(lián)合團(tuán)隊(duì)在機(jī)器人領(lǐng)域頂級(jí)會(huì)議 ICRA 2025 上發(fā)布最新研究成果 LaMMA-P(Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner)。
LaMMA-P 首次將大型語(yǔ)言模型與 PDDL 規(guī)劃器深度融合,解決了異構(gòu)多機(jī)器人系統(tǒng)中長(zhǎng)時(shí)任務(wù)的自動(dòng)分解與分配難題,大幅提升多機(jī)器人協(xié)同規(guī)劃的智能水平。該技術(shù)在全新基準(zhǔn)數(shù)據(jù)集上經(jīng)過大量模擬實(shí)驗(yàn)驗(yàn)證,相比現(xiàn)有最先進(jìn)方法 SMART-LLM,任務(wù)成功率提高 105%,執(zhí)行效率提升 36%,在復(fù)雜長(zhǎng)程任務(wù)規(guī)劃上取得了突破性進(jìn)展,為異構(gòu)多機(jī)器人協(xié)同完成復(fù)雜任務(wù)提供了全新解決方案。

- 論文標(biāo)題: LaMMA-P: Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner
 - 論文鏈接: https://arxiv.org/abs/2409.20560
 - 項(xiàng)目主頁(yè): https://lamma-p.github.io
 - 代碼開源: https://github.com/tasl-lab/LaMMA-P
 
技術(shù)亮點(diǎn):語(yǔ)言模型與經(jīng)典規(guī)劃算法融合,支撐通用異構(gòu)多機(jī)器人長(zhǎng)時(shí)協(xié)同任務(wù)
面對(duì)復(fù)雜長(zhǎng)時(shí)任務(wù)和異構(gòu)多機(jī)器人系統(tǒng),LaMMA-P 首創(chuàng)性地將大語(yǔ)言模型的語(yǔ)義理解能力與 PDDL 規(guī)劃器的嚴(yán)謹(jǐn)性結(jié)合,不僅解決了傳統(tǒng)方法在任務(wù)分解和資源分配上的瓶頸,還顯著提升了任務(wù)成功率與執(zhí)行效率。通過全面開源的代碼與 MAT-THOR 基準(zhǔn)數(shù)據(jù)集,LaMMA-P 為多機(jī)器人協(xié)同規(guī)劃開辟了新的技術(shù)路徑:
- 大模型驅(qū)動(dòng)的 PDDL 規(guī)劃框架:提出將大型語(yǔ)言模型 (Large Language Model, LLM) 的強(qiáng)大任務(wù)理解和推理能力與經(jīng)典規(guī)劃領(lǐng)域定義語(yǔ)言 (Planning Domain Definition Language, PDDL) 規(guī)劃器相結(jié)合的新框架。利用 LLM 將人類指令轉(zhuǎn)化為高層任務(wù)描述,再由 PDDL 規(guī)劃器進(jìn)行嚴(yán)謹(jǐn)?shù)淖尤蝿?wù)搜索和規(guī)劃,實(shí)現(xiàn)對(duì)長(zhǎng)時(shí)復(fù)雜任務(wù)的自動(dòng)分解與分配。該方法融合了學(xué)習(xí)式推理與啟發(fā)式搜索的優(yōu)勢(shì),既能理解復(fù)雜自然語(yǔ)言指令,又能提供可靠高效的規(guī)劃方案。
 - 模塊化設(shè)計(jì)與強(qiáng)泛化能力:LaMMA-P 采用模塊化架構(gòu),將大型語(yǔ)言模型、PDDL 規(guī)劃系統(tǒng)與仿真環(huán)境無(wú)縫集成。通過模塊間清晰的接口,系統(tǒng)可根據(jù)不同機(jī)器人技能靈活分解任務(wù)并高效分配子任務(wù)。該框架支持任意數(shù)量的機(jī)器人參與,同一套算法無(wú)需修改即可擴(kuò)展到更多機(jī)器人協(xié)作場(chǎng)景,體現(xiàn)出優(yōu)異的泛化能力。在不同家庭任務(wù)、不同機(jī)器人組合下,LaMMA-P 都能產(chǎn)出有效的協(xié)同計(jì)劃,表現(xiàn)出對(duì)任務(wù)種類和團(tuán)隊(duì)規(guī)模的強(qiáng)適應(yīng)性。
 - 新基準(zhǔn)數(shù)據(jù)集與性能超越:構(gòu)建了全新的多智能體長(zhǎng)時(shí)任務(wù)模擬基準(zhǔn) MAT-THOR,基于 AI2-THOR 仿真環(huán)境設(shè)計(jì)家庭場(chǎng)景下的復(fù)雜協(xié)同任務(wù)(包含簡(jiǎn)單復(fù)合任務(wù)和高復(fù)雜任務(wù)兩種級(jí)別)。該數(shù)據(jù)集為多機(jī)器人長(zhǎng)程任務(wù)規(guī)劃提供了標(biāo)準(zhǔn)評(píng)測(cè)平臺(tái)。實(shí)驗(yàn)結(jié)果顯示,LaMMA-P 在 MAT-THOR 基準(zhǔn)上取得了當(dāng)前最優(yōu)成績(jī):相較于最新的大模型多機(jī)器人規(guī)劃方案 SMART-LLM,LaMMA-P 的任務(wù)完成成功率提高了 105%,效率提升了 36%,在長(zhǎng)時(shí)任務(wù)的成功執(zhí)行率和執(zhí)行速度兩方面均大幅領(lǐng)先現(xiàn)有方法。
 
一、研究背景
隨著多機(jī)器人系統(tǒng)在搜救、倉(cāng)儲(chǔ)、家庭服務(wù)等場(chǎng)景中日益普及,讓多臺(tái)異構(gòu)機(jī)器人協(xié)同執(zhí)行復(fù)雜任務(wù)成為機(jī)器人領(lǐng)域的重要課題。在現(xiàn)實(shí)應(yīng)用中,長(zhǎng)時(shí)任務(wù)通常需要被分解為一系列關(guān)聯(lián)的子任務(wù),并合理分配給具備不同能力的機(jī)器人個(gè)體協(xié)同完成。例如家庭助理機(jī)器人需要合作完成 “整理房間” 這樣的復(fù)雜指令,其中包含搬運(yùn)物品、清潔、整理等多個(gè)步驟。然而,長(zhǎng)時(shí)任務(wù)的自動(dòng)分解與多機(jī)器人分工極具挑戰(zhàn):如何讓機(jī)器人隊(duì)伍理解人類的高層意圖,將其細(xì)化為可執(zhí)行的子任務(wù)清單,并根據(jù)每臺(tái)機(jī)器人的能力進(jìn)行最佳分配,是當(dāng)前智能體協(xié)作面臨的難點(diǎn)。
傳統(tǒng)的多機(jī)器人任務(wù)規(guī)劃方法往往依賴預(yù)先定義的規(guī)則或啟發(fā)式算法,在任務(wù)規(guī)模和復(fù)雜度較小時(shí)尚能奏效,但面對(duì)具有長(zhǎng)時(shí)間跨度、復(fù)雜依賴關(guān)系的任務(wù)時(shí)往往力不從心。這類方法缺乏對(duì)自然語(yǔ)言指令語(yǔ)義的深入理解,難以及時(shí)調(diào)整規(guī)劃來應(yīng)對(duì)動(dòng)態(tài)環(huán)境和任務(wù)變化。此外,基于大型語(yǔ)言模型的機(jī)器人任務(wù)規(guī)劃雖然在單機(jī)器人的簡(jiǎn)單任務(wù)上取得了一定進(jìn)展,但在多機(jī)器人協(xié)同的長(zhǎng)程任務(wù)上依然存在成功率低、效率差、難以泛化等問題。為了解決上述瓶頸,研究人員開始探索將新興的大語(yǔ)言模型與經(jīng)典人工智能規(guī)劃技術(shù)相結(jié)合,試圖兼顧兩者優(yōu)勢(shì)來提升多機(jī)器人系統(tǒng)的自主協(xié)同能力。LaMMA-P 正是在這樣的背景下應(yīng)運(yùn)而生。
二、研究方法
大型語(yǔ)言模型和啟發(fā)式搜索規(guī)劃器共同驅(qū)動(dòng)的多機(jī)器人規(guī)劃框架

面對(duì)異構(gòu)多機(jī)器人長(zhǎng)時(shí)任務(wù)規(guī)劃難題,LaMMA-P 提出了融合大型語(yǔ)言模型與 PDDL 規(guī)劃的創(chuàng)新框架。首先,系統(tǒng)利用大語(yǔ)言模型強(qiáng)大的推理與文本解析能力來理解復(fù)雜的自然語(yǔ)言指令,從中抽取高層任務(wù)目標(biāo)和約束,并生成初步的任務(wù)分解方案。接著,LaMMA-P 將任務(wù)分解結(jié)果轉(zhuǎn)換為形式化的 PDDL 表述,由經(jīng)典規(guī)劃器執(zhí)行全局搜索與最優(yōu)子任務(wù)規(guī)劃,找出滿足約束的最優(yōu)執(zhí)行序列和分配方案。在這個(gè)過程中,大語(yǔ)言模型負(fù)責(zé)語(yǔ)義理解和高層決策,PDDL 規(guī)劃器保證了規(guī)劃結(jié)果的嚴(yán)謹(jǐn)性和完備性。通過人機(jī)指令理解和形式規(guī)劃求解的結(jié)合,LaMMA-P 實(shí)現(xiàn)了對(duì)長(zhǎng)時(shí)任務(wù)既能清楚理解又能精確計(jì)算。
整個(gè)框架采用模塊化設(shè)計(jì),包括指令解析模塊、任務(wù)規(guī)劃模塊、執(zhí)行仿真模塊等。指令解析模塊由預(yù)訓(xùn)練的大型語(yǔ)言模型實(shí)現(xiàn),輸出任務(wù)結(jié)構(gòu)圖和初步分配建議;任務(wù)規(guī)劃模塊基于 PDDL,通過迭代深化搜索得到任務(wù)分配的具體行動(dòng)序列;執(zhí)行模塊在仿真環(huán)境中驗(yàn)證并反饋執(zhí)行結(jié)果用于可能的調(diào)整。各模塊解耦的設(shè)計(jì)使得增加機(jī)器人數(shù)量或更改任務(wù)類型時(shí)無(wú)需更改框架主體邏輯,只需調(diào)整相應(yīng)的任務(wù)描述和機(jī)器人能力配置,體現(xiàn)出高度的靈活性和通用性。
三、實(shí)驗(yàn)結(jié)果
性能全面超越現(xiàn)有方案
研究團(tuán)隊(duì)構(gòu)建了 MAT-THOR 數(shù)據(jù)集來評(píng)估 LaMMA-P 的有效性。MAT-THOR 基準(zhǔn)涵蓋了在家庭場(chǎng)景下多機(jī)器人協(xié)作完成長(zhǎng)時(shí)任務(wù)的多種情況,包括簡(jiǎn)單的順序任務(wù)和復(fù)雜的并行任務(wù),模擬真實(shí)家庭環(huán)境中的多樣挑戰(zhàn)。實(shí)驗(yàn)在不同數(shù)量機(jī)器人(包括 2 臺(tái)及更多)和不同任務(wù)復(fù)雜度組合下進(jìn)行,并將 LaMMA-P 與當(dāng)前最新的多機(jī)器人任務(wù)規(guī)劃方法 SMART-LLM 進(jìn)行了對(duì)比。實(shí)驗(yàn)從性能對(duì)比、模塊消融和可視化分析三個(gè)方面系統(tǒng)展示了 LaMMA-P 的優(yōu)勢(shì)。
1. 性能對(duì)比
LaMMA-P 在任務(wù)成功率、效率以及機(jī)器人利用率等多個(gè)核心指標(biāo)上均大幅領(lǐng)先當(dāng)前最優(yōu)方法 SMART-LLM (GPT-4o):

關(guān)鍵發(fā)現(xiàn):
- 長(zhǎng)時(shí)任務(wù)成功率提升顯著:在 Compound 任務(wù)中,成功率提升至 93%(領(lǐng)先 23%)。Complex 任務(wù)中,成功率提升至 77%(領(lǐng)先 57%)。在 Vague Command 任務(wù)中,成功率達(dá)到 45%,而現(xiàn)有方法完全失敗。
 - 效率與機(jī)器人利用率全面提升:執(zhí)行效率(Eff)在三類任務(wù)中分別提升 26% ~ 48%。機(jī)器人利用率(RU)在 Complex 任務(wù)中提升 22%,顯著優(yōu)化多機(jī)器人協(xié)作調(diào)度。執(zhí)行動(dòng)作可行性(Exe)達(dá)到 100%,保證任務(wù)分配后每一步都能順利完成。
 - 復(fù)雜任務(wù)中優(yōu)勢(shì)更加突出:隨著任務(wù)復(fù)雜度增加,LaMMA-P 優(yōu)勢(shì)愈發(fā)明顯,表現(xiàn)出卓越的泛化和推理能力。Vague Command 場(chǎng)景中唯一能夠成功完成任務(wù)的方法,展現(xiàn)強(qiáng)大的自然語(yǔ)言理解和模糊指令解析能力。
 
2. 模塊消融分析
通過消融不同模塊,驗(yàn)證了 LaMMA-P 各模塊對(duì)整體性能的關(guān)鍵貢獻(xiàn):

關(guān)鍵發(fā)現(xiàn):
- Precondition Identifier (P) 模塊顯著提升規(guī)劃成功率:移除 P 模塊后,Compound 任務(wù)成功率下降 14%,Complex 任務(wù)下降 9%。P 模塊幫助模型更好解析先決條件,提高子任務(wù)合理性和計(jì)劃成功率。
 - PDDL Validator (V) 和 Problem Generator (G) 提高執(zhí)行可靠性:去除 V 和 G 后,Complex 任務(wù)執(zhí)行率下降至 87%(相比完整系統(tǒng)的 100%)。V 模塊確保生成的 PDDL 問題格式正確,有效避免因不合規(guī)計(jì)劃導(dǎo)致的失敗。
 - 完整模塊組合帶來最優(yōu)性能:包含全部模塊的 LaMMA-P 實(shí)現(xiàn)最佳效果,Compound 任務(wù)成功率高達(dá) 93%,Complex 任務(wù)成功率達(dá) 77%。整體效率(Eff)提升最明顯,表明完整系統(tǒng)能夠優(yōu)化任務(wù)分解、資源調(diào)度與計(jì)劃執(zhí)行的全流程。
 
3. 可視化分析
通過 AI2-THOR 仿真環(huán)境可視化展示,直觀體現(xiàn) LaMMA-P 優(yōu)化的任務(wù)規(guī)劃效果:

關(guān)鍵發(fā)現(xiàn):
- 并行與順序任務(wù)合理調(diào)度:在 Compound 任務(wù)中,多個(gè)機(jī)器人基于自身能力并行執(zhí)行不同子任務(wù),提高整體任務(wù)完成速度。通過智能順序安排,避免因場(chǎng)景擁堵或任務(wù)沖突導(dǎo)致的執(zhí)行延遲。
 - 復(fù)雜依賴關(guān)系下的精準(zhǔn)協(xié)作:在 Complex 任務(wù)中,機(jī)器人能夠合理等待必要條件滿足(如等待抽屜被打開),體現(xiàn)對(duì)任務(wù)先后約束的精準(zhǔn)把控。有效減少無(wú)效等待和重復(fù)移動(dòng),提高機(jī)器人整體利用率。
 
四、總結(jié)與展望
多機(jī)器人協(xié)同規(guī)劃新范式
LaMMA-P 的提出為多機(jī)器人長(zhǎng)時(shí)任務(wù)協(xié)同規(guī)劃提供了全新的思路:它成功地將大模型的智能推理與經(jīng)典 PDDL 規(guī)劃有機(jī)結(jié)合,彌補(bǔ)了各自的短板,顯著提升了復(fù)雜任務(wù)的自動(dòng)化程度和執(zhí)行可靠性。這一成果標(biāo)志著異構(gòu)多機(jī)器人自主協(xié)作邁出了關(guān)鍵一步。在未來工作中,研究團(tuán)隊(duì)計(jì)劃進(jìn)一步探索端到端的優(yōu)化(例如使語(yǔ)言模型與規(guī)劃器聯(lián)結(jié)形成可微分閉環(huán)),以及引入多模態(tài)感知信息(如視覺、語(yǔ)音)來豐富指令理解,不斷提升系統(tǒng)在真實(shí)環(huán)境中的適應(yīng)性和魯棒性。隨著代碼、數(shù)據(jù)集和交互式演示的開源發(fā)布,更多研究者和開發(fā)者可以基于 LaMMA-P 框架進(jìn)行拓展創(chuàng)新,加速多機(jī)器人協(xié)同領(lǐng)域的技術(shù)演進(jìn)??梢灶A(yù)見,LaMMA-P 所代表的 “大模型驅(qū)動(dòng)規(guī)劃” 新范式有望在未來走出實(shí)驗(yàn)室,應(yīng)用到智能制造、家庭服務(wù)等眾多場(chǎng)景,推動(dòng)多機(jī)器人系統(tǒng)朝著更加高效、智能的方向發(fā)展。















 
 
 
















 
 
 
 