可遷移和可適應(yīng)的駕駛行為預(yù)測(cè)
arXiv上傳于2022年2月10日的論文“Transferable and Adaptable Driving Behavior Prediction”,伯克利分校工作。
雖然自動(dòng)駕駛汽車仍難以解決道路行駛中的挑戰(zhàn)性問題,但人類早已掌握高效、可遷移和可適應(yīng)的駕駛本質(zhì)。通過模仿人類在駕駛過程中的認(rèn)知模型和語義理解,HATN,一個(gè)分層框架,為多智體密集交通環(huán)境的駕駛行為生成高質(zhì)量、可遷移和可適應(yīng)的預(yù)測(cè)。這個(gè)分層方法由高級(jí)別意圖識(shí)別策略和低級(jí)軌跡生成策略組成。其中定義一種新的語義子任務(wù),并給出每個(gè)子任務(wù)的通用狀態(tài)表示。有了這些技術(shù),分層結(jié)構(gòu)可以在不同的駕駛場(chǎng)景中遷移。
此外,該模型通過在線適應(yīng)模塊捕捉個(gè)人和場(chǎng)景之間駕駛行為的變化。在開源INTERACTION數(shù)據(jù)集,通過十字路口和環(huán)島的軌跡預(yù)測(cè)任務(wù)展示該算法的性能。
提出的HATN(Hierarchical Adaptable and Transferable Network)框架由四部分組成:
1)左側(cè),提取自車的交互車輛,并構(gòu)造語義圖(Semantic Graph,SG)。在SG中,定義動(dòng)態(tài)插入?yún)^(qū)域(Dynamic Insertion Areas,DIA)為圖形的節(jié)點(diǎn),自車可以選擇插入其中。
2) 高級(jí)別的語義圖網(wǎng)絡(luò)(Semantic Graph Network,SGN)以SG為輸入,負(fù)責(zé)對(duì)車輛之間的關(guān)系進(jìn)行推理,并預(yù)測(cè)單個(gè)車輛的意圖,例如插入哪個(gè)區(qū)域和相應(yīng)的目標(biāo)狀態(tài)。
3) 低級(jí)別編解碼網(wǎng)絡(luò)(Encoder Decoder Network,EDN)接收每輛車的歷史動(dòng)態(tài)和意圖信號(hào),并預(yù)測(cè)其未來軌跡。
4) 在線適應(yīng)(OA)模塊根據(jù)歷史預(yù)測(cè)誤差在線適應(yīng)EDN的參數(shù),該誤差捕捉個(gè)體和場(chǎng)景特定的行為。
如圖是HATN的方框圖:
下表正式闡明HATN每個(gè)模塊的輸入和輸出:
關(guān)于各個(gè)模型的描述如下:
HATN
SG (scene graph representation)
SGN
EDN
MEKF(modified Extended Kalman Filter)
提取的DIA是一個(gè)動(dòng)態(tài)區(qū)域,可以由自智體在路上插入或進(jìn)入。每個(gè)DIA由前智體形成的前邊界、后智體形成的后邊界和參考線形成的兩個(gè)側(cè)邊界組成。如圖是DIA提取和SG構(gòu)建過程:當(dāng)其他車輛的車道參考線(通過Dynamic Time Warping 算法確認(rèn))與自車的車道參考線交叉時(shí),基于沖突點(diǎn),提取DIA并將其視為節(jié)點(diǎn)來構(gòu)建SG。
為了推斷任意兩個(gè)節(jié)點(diǎn)之間的關(guān)系,受Graph Attention Network(GAN)的啟發(fā),設(shè)計(jì)一個(gè)基于注意的關(guān)系推理層。
一旦高級(jí)別策略決定了要去哪里,低級(jí)別策略就負(fù)責(zé)通過更精細(xì)粒度處理信息來實(shí)現(xiàn)這一目標(biāo),其從分層設(shè)計(jì)中得到好處:
1)學(xué)習(xí)被簡(jiǎn)化,因?yàn)檐囕v只需要關(guān)心自己的動(dòng)力學(xué),而交互、避撞、道路幾何的考慮則留給高層策略來處理(信息隱藏);
2) 該策略僅為達(dá)到目標(biāo)(獎(jiǎng)勵(lì)隱藏)而優(yōu)化,這是可控和可解釋的,因?yàn)椴煌胧┑男Ч梢愿玫仳?yàn)證;
3) 學(xué)習(xí)的策略可以在不同的場(chǎng)景中轉(zhuǎn)換和重用。
在實(shí)踐中,來自高級(jí)別策略的預(yù)測(cè)意圖信號(hào)本身可能攜帶來自高層策略或數(shù)據(jù)分布的誤差方差。實(shí)證發(fā)現(xiàn),最佳性能表現(xiàn)在:
1)在Frenet坐標(biāo)下;
2)包括速度和偏航等輸入特征;
3)應(yīng)用增量預(yù)測(cè)和位置對(duì)齊等表示技巧;
4)在輸入特征中添加目標(biāo)狀態(tài)和解碼步驟等意圖信號(hào)。
不同的駕駛場(chǎng)景也不可避免地會(huì)產(chǎn)生額外的行為變化。因此,利用在線適應(yīng)(基于卡爾曼濾波器)將定制的個(gè)人和場(chǎng)景模式注入到模型中。在線適應(yīng)的關(guān)鍵點(diǎn)是,由于駕駛員無法直接溝通,歷史行為可能是駕駛員駕駛模式的重要線索,基于此,調(diào)整模型參數(shù)以更好地適應(yīng)個(gè)人或場(chǎng)景。
在線適應(yīng)背后的直覺是,盡管給定了相同的目標(biāo)狀態(tài),但駕駛員仍有不同的方式來實(shí)現(xiàn)它。捕獲這種定制模式可以改善生成的行為人類相似性。其整個(gè)算法的偽代碼如下圖:
如下是3個(gè)實(shí)驗(yàn)場(chǎng)景:
1) 自車如何與其他車輛交互以通過一個(gè)共同沖突點(diǎn)(一次交互);
2) 自車如何與其他車輛互動(dòng),以通過一系列沖突點(diǎn)(一系列互動(dòng));
3) 無需再訓(xùn)練就將自車遷移到環(huán)島場(chǎng)景時(shí),自車與其他車輛的交互方式(場(chǎng)景可遷移交互)。
場(chǎng)景:一次交互
場(chǎng)景:一系列交互
場(chǎng)景:可遷移交互
下兩個(gè)表是在十字路口和環(huán)島場(chǎng)景中HATN和其他6種方法的比較:
1.無時(shí)域:該方法不考慮歷史信息,即只考慮當(dāng)前時(shí)間步長(zhǎng)t的信息。
2.GAT:這種方法使用絕對(duì)特征來計(jì)算節(jié)點(diǎn)之間的關(guān)系,而不是使用相對(duì)特征。這種方法對(duì)應(yīng)于原始的圖形注意網(wǎng)絡(luò)(GAN)。
3、單智體:該方法只考慮自車意圖預(yù)測(cè)的損失,不考慮其他車輛的意圖預(yù)測(cè)。
4.兩層圖:這方法有一個(gè)兩層圖來進(jìn)行信息嵌入,即兩次利用圖進(jìn)行聚合。
5.多頭:這方法利用多頭注意機(jī)制來穩(wěn)定學(xué)習(xí)。該方法在Sec中操作關(guān)系推理。4.2.2獨(dú)立并行多次,并連接所有聚合特征作為最終聚合特征。
6.Seq Graph:該方法首先在每個(gè)時(shí)間步對(duì)圖進(jìn)行關(guān)系推理,然后將聚合圖序列饋送到RNN中進(jìn)行時(shí)間處理。作為比較,我們的方法首先將每個(gè)節(jié)點(diǎn)的歷史特征序列嵌入到RNN中,然后使用每個(gè)節(jié)點(diǎn)在當(dāng)前時(shí)間步的隱藏狀態(tài)從RNN中進(jìn)行關(guān)系推理。
一些觀察:
1)HATN在交叉口和環(huán)島實(shí)現(xiàn)了最低誤差;
2) 由于缺乏時(shí)域信息,無時(shí)域方法在交叉口和環(huán)島場(chǎng)景中都是最差的;
3) GAT方法產(chǎn)生的錯(cuò)誤比HATN高得多,尤其是在環(huán)島場(chǎng)景(58%),這表明在關(guān)系推理中使用相關(guān)特征的必要性;
4) HATN優(yōu)于單智體方法,這意味著將所有車輛生成的目標(biāo)狀態(tài)納入損失函數(shù),可以增加數(shù)據(jù)并鼓勵(lì)交互推理;
5) 兩層圖法是最接近HATN的方法,盡管根據(jù)訓(xùn)練記錄,它有嚴(yán)重的過擬合;
6) 多頭方法在交叉口場(chǎng)景中獲得了第二高精度,但在環(huán)島場(chǎng)景中的性能要差得多,仔細(xì)調(diào)整或搜索合適的頭數(shù)可以來改善;
7) 在交叉口和環(huán)島的情況下,Seq Graph方法是第二差的,這可能意味著對(duì)、過去的交互進(jìn)行復(fù)雜編碼很難幫助預(yù)測(cè),但確實(shí)會(huì)使學(xué)習(xí)更加困難。
下表是意圖信號(hào)的影響:
如下表是基于規(guī)則和基于學(xué)習(xí)的方法和HATN的比較: