偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

在混合交通流中網(wǎng)聯(lián)自動駕駛車如何避撞:一個(gè)基于模型的強(qiáng)化學(xué)習(xí)方法

人工智能 無人駕駛
本文研究混合交通流,即網(wǎng)聯(lián)自動駕駛車 (CAV)、人類駕駛汽車 (HDV) 和網(wǎng)聯(lián)人類駕駛車輛 (CHDV)組成,最近這種研究方向的論文不常見。

[[429494]]

 arXiv上傳于2021年10月11日的論文 “Addressing crash-imminent situations caused by human driven vehicle errors in a mixed traffic stream: a model-based reinforcement learning approach for CAV“,作者來自普渡大學(xué)的網(wǎng)聯(lián)自動化交通中心(Center for Connected and Automated Transportation,CCAT),其中一個(gè)是從CMU的機(jī)器人研究所(RI)來的訪問教授。

本文也是研究混合交通流,即網(wǎng)聯(lián)自動駕駛車 (CAV)、人類駕駛汽車 (HDV) 和網(wǎng)聯(lián)人類駕駛車輛 (CHDV)組成,最近這種研究方向的論文不常見。

本文開發(fā)一個(gè)簡單的基于模型的強(qiáng)化學(xué)習(xí) (RL) 系統(tǒng),部署在 CAV上生成預(yù)測和避免HDV引起碰撞的軌跡。該模型涉及端到端的數(shù)據(jù)驅(qū)動方法,包含基于深度學(xué)習(xí)的運(yùn)動預(yù)測模型和通過MPC的快速軌跡規(guī)劃算法。

這個(gè)系統(tǒng)不需要車輛動力學(xué)的物理環(huán)境先驗(yàn)知識或假設(shè),是一種可以部署在任何類型車輛(例如卡車、公共汽車、摩托車等)的通用方法。在 CARLA 模擬器進(jìn)行多個(gè)即將發(fā)生碰撞場景的訓(xùn)練和測試。

大家認(rèn)為有車聯(lián)網(wǎng)(V2X)的網(wǎng)聯(lián)自駕車(CAV) 是實(shí)現(xiàn)零事故的關(guān)鍵。不過,仍然需要很多安全緊要的場景數(shù)據(jù),往往這個(gè)比較稀少缺乏。

基于模型的強(qiáng)化學(xué)習(xí)(RL)利用數(shù)據(jù)估計(jì)狀態(tài)轉(zhuǎn)換模型,然后根據(jù)估計(jì)模型進(jìn)行規(guī)劃。 這種組合方法從兩種方法中獲益:數(shù)據(jù)/訓(xùn)練的高效和模型不可知性。

一般來說,用于AV軌跡規(guī)劃的基于模型RL方法包含2個(gè)模塊:狀態(tài)預(yù)測和路徑規(guī)劃。 狀態(tài)預(yù)測作為對物理環(huán)境的估計(jì),專門解決從先前信息推理未來狀態(tài)的問題。 換句話說,它根據(jù)歷史軌跡“告訴”周圍目標(biāo)在不久的將來(預(yù)測范圍)將達(dá)到的狀態(tài)(位置、速度、加速度等)。

這里狀態(tài)預(yù)測模塊是基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),實(shí)驗(yàn)中測試了三種模型,包括3-layer fully connected neural network (FCN), single layer long short-term memory network (LSTM), single layer FCN (linear regression)。因?yàn)橹車囕v的變化,采用分散預(yù)測模式,而不是中心化模式,即每個(gè)智體有不同的狀態(tài)預(yù)測模型。

路徑規(guī)劃建立在狀態(tài)預(yù)測模型之上。由于狀態(tài)預(yù)測不完美,規(guī)劃模塊應(yīng)該穩(wěn)健地輸出安全路徑來阻止錯(cuò)誤傳播。其次,規(guī)劃模塊應(yīng)該適應(yīng)高動態(tài)場景,特別是在新智體出現(xiàn)的情況下(行人突然橫穿馬路或周圍車輛激進(jìn)變道)。

模型預(yù)測控制 (MPC) 是一種常見的控制方法,一種滿足上述這兩個(gè)標(biāo)準(zhǔn)的通用方法。關(guān)鍵思想是在每個(gè)時(shí)間步“重規(guī)劃”,只執(zhí)行當(dāng)前最優(yōu)軌跡的第一步。由于每個(gè)時(shí)間步評估動作的可行性,該方法能夠處理快速變化的場景。

經(jīng)典 MPC 試圖將規(guī)劃問題表述為具有“給定”物理環(huán)境模型(系統(tǒng)動力學(xué))的復(fù)雜優(yōu)化問題。在基于模型RL 設(shè)置中,作者把MPC 與數(shù)據(jù)驅(qū)動的狀態(tài)預(yù)測模塊結(jié)合,用快速簡單的規(guī)劃算法代替復(fù)雜優(yōu)化算法。所提出方法的優(yōu)點(diǎn)包括:數(shù)據(jù)高效、模型可解釋、穩(wěn)定和跨場景遷移(穩(wěn)?。?。

MPC的規(guī)劃方法包括4個(gè)步驟:

  • (1) 每個(gè)時(shí)間步生成 序列,每個(gè)序列包含ℎ個(gè)動作,其中 是測試軌跡數(shù),ℎ是規(guī)劃范圍。
  • (2) 每個(gè)軌跡,依次將總ℎ動作輸入狀態(tài)預(yù)測模型,計(jì)算每一步的未來狀態(tài)和成本。
  • (3) 匯總每個(gè)軌跡的成本。
  • (4) 選取累積成本最低的軌跡,執(zhí)行該軌跡的第一個(gè)動作。

整個(gè)端到端算法如下所示:

該端到端算法包含 3 個(gè)主要階段:預(yù)熱階段(收集數(shù)據(jù)); 訓(xùn)練階段(估計(jì)狀態(tài)預(yù)測模型)和路徑規(guī)劃階段(避免碰撞)。 這 3 個(gè)步驟遵循基于模型 RL 方法的過程:收集經(jīng)驗(yàn)、估計(jì)模型和用估計(jì)模型進(jìn)行規(guī)劃。 測試(規(guī)劃)階段的經(jīng)驗(yàn)可被加入重放內(nèi)存,重新訓(xùn)練模型,保證部署之后仍然可以改進(jìn)模型。

如圖所示是2 種碰撞緊要情況:主要源于圖中灰色車輛的非法或侵略性變道;紅色車輛處于灰色車輛的盲點(diǎn),這種情況在現(xiàn)實(shí)世界中會出現(xiàn)。

在CARLA中模擬4 輛車,如圖所示:黃色車輛代表“有故障”的 HDV,而 CAV 為紅色。

圖中黃色 HDV 希望超車越過灰色車輛,但未能識別其盲點(diǎn)中的紅色車輛 (CAV)。這種激進(jìn)的變道可能會導(dǎo)致碰撞,尤其是在駕駛環(huán)境緊湊的情況下(CAV 不能用力剎車,因?yàn)檫@會導(dǎo)致與藍(lán)色 HDV 發(fā)生追尾)。需要 CAV 產(chǎn)生一系列機(jī)動,避免系統(tǒng)崩潰。在模擬中,還建立黃色 HDV 從左側(cè)超車的場景,可能導(dǎo)致和右側(cè) CAV 的側(cè)面碰撞。

模擬步長為0.05s/step(或20step/s),黃色HDV的激進(jìn)超車動作是通過Logitech G27 Racing Wheel手動駕駛生成。另外,作者開發(fā)了一個(gè) Open AI gym 與 Python API 的接口連接 CARLA 模擬器。

如下是不同駕駛速度下成功避撞的實(shí)驗(yàn)結(jié)果比較:

 

責(zé)任編輯:張燕妮 來源: 自動駕駛的挑戰(zhàn)和發(fā)展
相關(guān)推薦

2023-08-05 13:08:54

2023-01-04 10:02:53

強(qiáng)化學(xué)習(xí)自動駕駛

2021-10-15 15:29:59

自動駕駛數(shù)據(jù)人工智能

2021-05-11 12:08:39

大數(shù)據(jù)自動駕駛數(shù)據(jù)分析

2024-04-10 14:10:33

自動駕駛強(qiáng)化學(xué)習(xí)

2017-07-30 15:16:31

深度強(qiáng)化學(xué)習(xí)遷移交叉路口

2021-10-12 10:28:34

自動駕駛數(shù)據(jù)人工智能

2025-03-24 09:50:00

大模型自動駕駛AI

2022-08-26 14:44:32

強(qiáng)化學(xué)習(xí)AI

2023-07-18 15:57:23

自動駕駛

2025-01-26 11:00:00

2024-03-19 13:12:36

自動駕駛模型

2023-11-20 09:53:13

自動駕駛系統(tǒng)

2023-03-23 18:42:45

AI強(qiáng)化學(xué)習(xí)

2024-02-20 11:26:07

物聯(lián)網(wǎng)

2021-12-16 10:45:22

自動駕駛數(shù)據(jù)人工智能

2024-12-09 08:45:00

模型AI

2022-07-12 09:42:10

自動駕駛技術(shù)

2022-11-21 11:50:59

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號