偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

讓機(jī)器人在人群中穿梭自如,港科廣&港科大突破社交導(dǎo)航盲區(qū) | ICRA 2025

人工智能 新聞
社交導(dǎo)航?(SocialNav,Social navigation)?是指在人機(jī)共存的環(huán)境中,機(jī)器人在遵循社會(huì)規(guī)范的前提下執(zhí)行導(dǎo)航任務(wù)。

機(jī)器人落地復(fù)雜場(chǎng)景,社交導(dǎo)航能力一定是避不開(kāi)的關(guān)鍵一點(diǎn)。

先簡(jiǎn)單介紹下,社交導(dǎo)航 (SocialNav,Social navigation) 是指在人機(jī)共存的環(huán)境中,機(jī)器人在遵循社會(huì)規(guī)范的前提下執(zhí)行導(dǎo)航任務(wù)。

就拿下圖來(lái)說(shuō),機(jī)器人需導(dǎo)航至目標(biāo)點(diǎn),而目標(biāo)恰好位于兩名行人未來(lái)軌跡的交匯區(qū)域。

它不僅要靈活避免潛在的碰撞風(fēng)險(xiǎn),還需與行人保持合適的社交距離。

圖片

總而言之,社交導(dǎo)航該任務(wù)對(duì)視覺(jué)導(dǎo)航領(lǐng)域提出了獨(dú)特挑戰(zhàn):

預(yù)建地圖的方法難以適應(yīng)人群密集的動(dòng)態(tài)環(huán)境,而現(xiàn)有RL方法存在短視決策和依賴全局信息的問(wèn)題。

近期,香港科技大學(xué)(廣州)和香港科技大學(xué)聯(lián)合提出了一種新算法,Falcon。

它通過(guò)將軌跡預(yù)測(cè)算法融入社交導(dǎo)航任務(wù)中,實(shí)現(xiàn)長(zhǎng)期動(dòng)態(tài)避障并提升導(dǎo)航性能。

圖片

社交導(dǎo)航的另一個(gè)重要挑戰(zhàn)則是現(xiàn)有基準(zhǔn)的真實(shí)性不足。

如下所示,現(xiàn)有基準(zhǔn)通常存在以下幾方面的局限性:

  • 場(chǎng)景復(fù)雜性不足:僅關(guān)注機(jī)器人與人類的交互,而忽略場(chǎng)景本身復(fù)雜性。
  • 人類行為不自然:行人動(dòng)作僵硬、運(yùn)動(dòng)模式失真,難以反映實(shí)際場(chǎng)景交互。

圖片

針對(duì)上述局限性,研究團(tuán)隊(duì)構(gòu)建了兩個(gè)新數(shù)據(jù)集——Social-HM3D 和 Social-MP3D,作為社交導(dǎo)航任務(wù)的新基準(zhǔn)。

該項(xiàng)目論文已被ICRA 2025接收,同時(shí)已經(jīng)掛上arXiv。

代碼和模型權(quán)重可到GitHub尋找。

圖片

Falcon:集成軌跡預(yù)測(cè)輔助任務(wù)的強(qiáng)化學(xué)習(xí)框架

Falcon算法框架由2個(gè)模塊組成:

  1. 主策略網(wǎng)絡(luò) (MPN,Main Policy Network)
  2. 時(shí)空預(yù)知模塊 (SPM,Spatial-temporal Precognition Module)

圖片

主策略網(wǎng)絡(luò):讓機(jī)器人學(xué)會(huì)“遵守規(guī)則”

模塊一,主策略網(wǎng)絡(luò),這是Falcon的“大腦”,負(fù)責(zé)指導(dǎo)機(jī)器人如何行動(dòng)。

其核心是社會(huì)認(rèn)知懲罰(SCP,Social Cognition Penalty)機(jī)制,通過(guò)設(shè)計(jì)專門的懲罰函數(shù),避免機(jī)器人干擾人類未來(lái)軌跡,從而引導(dǎo)智能體規(guī)避碰撞風(fēng)險(xiǎn)并保持社交距離。

具體而言,F(xiàn)alcon引入三個(gè)關(guān)鍵懲罰項(xiàng):

  • 障礙物碰撞懲罰 :嚴(yán)厲懲罰機(jī)器人撞到靜態(tài)障礙物或行人。
  • 人類接近懲罰:當(dāng)機(jī)器人靠近行人時(shí),隨距離減小增加懲罰。
  • 軌跡阻礙懲罰:如果機(jī)器人干擾行人未來(lái)路徑,則提前施加懲罰。

時(shí)空預(yù)知模塊:讓機(jī)器人學(xué)會(huì)“提前規(guī)劃”

模塊二,時(shí)空預(yù)知模塊(SPM),結(jié)合軌跡預(yù)測(cè)與多種社交感知輔助任務(wù),顯著增強(qiáng)了機(jī)器人對(duì)未來(lái)環(huán)境動(dòng)態(tài)變化的預(yù)測(cè)能力。

其主要功能包括:

  • 人類數(shù)量估計(jì):預(yù)測(cè)場(chǎng)景中有多少人,幫助評(píng)估環(huán)境復(fù)雜程度。
  • 當(dāng)前位置跟蹤:實(shí)時(shí)跟蹤行人位置,快速響應(yīng)變化。
  • 未來(lái)軌跡預(yù)測(cè):預(yù)測(cè)未來(lái)幾秒行人路徑,提前規(guī)劃避障。

關(guān)鍵在于,輔助任務(wù)僅在訓(xùn)練階段使用

在推理階段,機(jī)器人僅依賴主策略網(wǎng)絡(luò)進(jìn)行決策。

這種設(shè)計(jì)簡(jiǎn)化了推理過(guò)程,確保模型在實(shí)際應(yīng)用中的高效性。

特意構(gòu)建兩個(gè)新的數(shù)據(jù)集

現(xiàn)有社交導(dǎo)航基準(zhǔn)存在諸多不足,如場(chǎng)景過(guò)于簡(jiǎn)化、人類行為不自然等。

以下表格為現(xiàn)有的社交導(dǎo)航模擬器與數(shù)據(jù)集統(tǒng)計(jì)特性對(duì)比:

圖片

為彌補(bǔ)這些缺陷,研究人員構(gòu)建了兩個(gè)新數(shù)據(jù)集——Social-HM3D和Social-MP3D,具備以下優(yōu)勢(shì):

  • 真實(shí)場(chǎng)景重建:基于高精度3D掃描,涵蓋公寓、辦公樓、商場(chǎng)等多種室內(nèi)場(chǎng)景。
  • 自然人類行為:采用多目標(biāo)導(dǎo)向的軌跡生成算法和ORCA動(dòng)態(tài)避障模型,模擬人類行走、休息等自然行為。
  • 合理人群密度:根據(jù)場(chǎng)景面積動(dòng)態(tài)調(diào)整人類數(shù)量,確保交互密度適中。

研究團(tuán)隊(duì)表示,這兩個(gè)基準(zhǔn)既平衡了人機(jī)交互的社交密度,同時(shí)也避免了過(guò)度擁擠。

圖片

這一基準(zhǔn)為社交導(dǎo)航研究提供了更貼近真實(shí)場(chǎng)景的評(píng)估環(huán)境,并且支持推廣到有人環(huán)境下的物體導(dǎo)航、圖像導(dǎo)航等下游任務(wù)。

實(shí)驗(yàn)部分

在定量分析方面,實(shí)驗(yàn)表明,F(xiàn)alcon在目標(biāo)達(dá)成和社會(huì)合規(guī)方面表現(xiàn)出色:

其一是目標(biāo)達(dá)成

在Social-HM3D中達(dá)到55.15%的成功率和成功路徑效率(SPL,Success weighted by Path Length)。

即使在未訓(xùn)練過(guò)的Social-MP3D數(shù)據(jù)集上,也能取得55.05%的成功率。

其二是社會(huì)合規(guī)。

在保持社交距離和避免碰撞方面表現(xiàn)良好,達(dá)到接近90%的個(gè)人空間合規(guī)性(Personal Space Compliance, PSC)和接近42%的人機(jī)碰撞率。

圖片

定量結(jié)果表明,F(xiàn)alcon不僅在已知環(huán)境中表現(xiàn)出色,還能有效適應(yīng)未見(jiàn)過(guò)的復(fù)雜動(dòng)態(tài)環(huán)境。

在定性分析方面,下圖的定性結(jié)果展示了Falcon在不同典型場(chǎng)景中的優(yōu)越性——

第一個(gè)是人員跟隨情境。

Falcon通過(guò)預(yù)測(cè)行人未來(lái)軌跡,主動(dòng)調(diào)整速度和路徑,保持安全距離。

圖片

第二個(gè)是復(fù)雜交叉路口。

面對(duì)行人和靜態(tài)障礙物同時(shí)存在的場(chǎng)景,F(xiàn)alcon提前預(yù)測(cè)并規(guī)劃出安全高效的路徑。

圖片

第三個(gè)是正面接近情境。

傳統(tǒng)的RL算法Proximity-Aware試圖直接從行人面前穿過(guò)導(dǎo)致碰撞,F(xiàn)alcon通過(guò)預(yù)測(cè)行人未來(lái)軌跡,提前調(diào)整路徑并安全避開(kāi)。

圖片

3個(gè)關(guān)鍵發(fā)現(xiàn)

各項(xiàng)實(shí)驗(yàn)后,團(tuán)隊(duì)有了三個(gè)關(guān)鍵發(fā)現(xiàn):

發(fā)現(xiàn)1,未來(lái)感知算法優(yōu)于以往實(shí)時(shí)感知算法。

靜態(tài)路徑規(guī)劃算法(如A*)無(wú)法適應(yīng)動(dòng)態(tài)環(huán)境,而實(shí)時(shí)感知方法(如ORCA和Proximity-Aware)雖能被動(dòng)避障,但仍存在延遲反應(yīng)問(wèn)題。

相比之下,F(xiàn)alcon能夠主動(dòng)預(yù)測(cè)行人軌跡并提前調(diào)整路徑,顯著提升了安全性和效率。

發(fā)現(xiàn)2,輔助任務(wù)有助于提高性能,其中軌跡預(yù)測(cè)最重要。

下表展示了不同輔助任務(wù)對(duì)導(dǎo)航性能的影響。

其中軌跡預(yù)測(cè)(SPM.Traj)效果最為顯著,成功率從40.94%提升至54.00%。

圖片

發(fā)現(xiàn)3,SCP和SPM相輔相成,改善性能并加快訓(xùn)練收斂。

下圖圖中為消融研究中的訓(xùn)練曲線。

可以觀察到,具有SPM和SCP的完整Falcon模型收斂更快,性能更好。

圖片

SCP在提升模型性能方面發(fā)揮關(guān)鍵作用,尤其是與SPM集成后,整體性能進(jìn)一步提升(從53.63%提高至55.15%),并加快訓(xùn)練收斂速度。

項(xiàng)目主頁(yè):
https://zeying-gong.github.io/projects/falcon/
論文鏈接:
https://arxiv.org/abs/2409.13244
代碼鏈接:
https://github.com/Zeying-Gong/Falcon


責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2025-05-06 08:50:00

2024-12-20 09:30:00

模型訓(xùn)練數(shù)據(jù)

2025-03-19 10:00:41

2025-03-27 10:54:06

2021-12-02 13:57:44

機(jī)器人人工智能AI

2025-03-31 09:22:00

強(qiáng)化學(xué)習(xí)模型AI

2022-04-13 11:03:07

社交機(jī)器人人工智能機(jī)器人

2024-01-26 16:33:00

2023-10-10 12:31:26

AI數(shù)據(jù)

2025-03-26 09:55:14

2023-08-09 17:10:01

論文獲獎(jiǎng)

2021-06-22 15:20:53

機(jī)器人人工智能技術(shù)

2024-12-02 09:25:00

2023-10-07 10:05:28

機(jī)器人工業(yè)4.0

2025-01-17 11:07:28

2012-11-28 11:05:29

co-worker

2025-06-12 11:56:30

模型框架開(kāi)源

2024-12-30 13:40:00

2025-03-31 09:17:00

自動(dòng)駕駛模型AI

2023-03-04 21:12:25

ChatGPTAI課程
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)