軌跡預(yù)測新基準!清華開源Ultra-AV:統(tǒng)一自動駕駛縱向軌跡數(shù)據(jù)集
摘要
自動駕駛車輛在交通運輸領(lǐng)域展現(xiàn)出巨大潛力,而理解其縱向駕駛行為是實現(xiàn)安全高效自動駕駛的關(guān)鍵?,F(xiàn)有的開源AV軌跡數(shù)據(jù)集在數(shù)據(jù)精煉、可靠性和完整性方面存在不足,從而限制了有效的性能度量分析和模型開發(fā)。
本研究針對這些挑戰(zhàn),構(gòu)建了一個(Ultra-AV),用于分析自動駕駛汽車的微觀縱向駕駛行為。該數(shù)據(jù)集整合了來自14 個的數(shù)據(jù),涵蓋多種自動駕駛汽車類型、測試場景和實驗環(huán)境。我們提出了一種數(shù)據(jù)處理框架,以獲得高質(zhì)量的縱向軌跡數(shù)據(jù)和跟馳軌跡數(shù)據(jù)。最后,本研究通過對安全性、通行效率、穩(wěn)定性和可持續(xù)性等多個性能維度的評估,以及對跟馳模型變量之間關(guān)系的分析,驗證了數(shù)據(jù)的有效性。我們的工作不僅為研究人員提供了標準化的數(shù)據(jù)和指標,用于分析自動駕駛汽車的縱向行為,還為數(shù)據(jù)采集和模型開發(fā)提供了指導方法**。
介紹
理解自動駕駛汽車的縱向駕駛行為對于確保其安全性和優(yōu)化交通流至關(guān)重要。然而,現(xiàn)有的開源自動駕駛汽車軌跡數(shù)據(jù)集缺乏精細的數(shù)據(jù)清理和標準化,導致:
- 數(shù)據(jù)質(zhì)量不均,影響模型開發(fā)和性能評估。
 - 缺乏完整性和可靠性,難以進行跨數(shù)據(jù)集研究。
 - 分析效率低,影響AV安全測試和仿真研究。
 
本研究提出了一種統(tǒng)一的自動駕駛汽車縱向軌跡數(shù)據(jù)集(Ultra-AV),有以下特點:
- 大規(guī)模數(shù)據(jù)集: 數(shù)據(jù)總量 2.6GB,涵蓋 14 個不同的自動駕駛數(shù)據(jù)源,涉及 30 多種測試和實驗場景,包含 超過 1000 萬個數(shù)據(jù)點,相當于 280 小時以上的行駛數(shù)據(jù)。
 - 標準化數(shù)據(jù)格式: 統(tǒng)一不同數(shù)據(jù)源的數(shù)據(jù)格式,使其適用于跨數(shù)據(jù)集研究。
 - 數(shù)據(jù)處理框架: 提供一種高效的數(shù)據(jù)處理方法,提高數(shù)據(jù)的可用性,支持自動駕駛仿真測試和行為建模。
 

方法
如圖所示,我們的統(tǒng)一數(shù)據(jù)集涵蓋了14個不同來源的數(shù)據(jù)集。這些數(shù)據(jù)集收集自美國和歐洲的多個城市,確保了所選城市的多樣性和代表性,使研究具備更廣泛的適用性。

此外,大多數(shù)被整合的數(shù)據(jù)集都包含自動駕駛汽車的長時間軌跡,這些數(shù)據(jù)廣泛應(yīng)用于自動駕駛行為分析。然而,一些特定數(shù)據(jù)集,如 Waymo Open Dataset中的 Waymo Motion Dataset 和Argoverse 2 Motion Forecasting Dataset,其軌跡時間較短,分別為9.1 秒和11 秒(采樣頻率為 10Hz)。這些數(shù)據(jù)集主要用于Motion Forecasting領(lǐng)域的研究,盡管軌跡較短,但其采集地點通常位于復(fù)雜交通環(huán)境中的市區(qū),能夠提供在復(fù)雜場景下分析自動駕駛行為的機會。因此,本研究特別包含了對這兩個數(shù)據(jù)集的分析,以確保數(shù)據(jù)集的全面性和適用性。
本研究提出了一種數(shù)據(jù)處理框架,用于標準化并清理自動駕駛汽車軌跡數(shù)據(jù)。該框架包含以下三步。
Step 1: 軌跡數(shù)據(jù)提取
從多個AV數(shù)據(jù)集中提取統(tǒng)一格式的縱向軌跡數(shù)據(jù),包括汽車位置、速度、車頭時距等關(guān)鍵變量。關(guān)鍵變量如下:
變量  | 描述  | 
Trajectory ID  | 軌跡數(shù)據(jù)的唯一標識  | 
Time Index  | 軌跡數(shù)據(jù)時間索引  | 
LV Position  | 領(lǐng)航車(LV)位置  | 
LV Speed  | 領(lǐng)航車速度  | 
FAV Position  | 跟馳車(FAV)位置  | 
FAV Speed  | 跟馳車速度  | 
Space Headway  | 車頭間距  | 
Speed Difference  | 車速差  | 
針對處理過后的數(shù)據(jù),我們通過三個方面對數(shù)據(jù)進行驗證分析。
Step 2: 通用數(shù)據(jù)清理
為了提高數(shù)據(jù)的可靠性,采用以下清理策略:
- 移除異常值: 刪除超過 均值 ± 標準差 的數(shù)據(jù)點。
 - 缺失值填補: 刪除時間戳不連續(xù)的數(shù)據(jù)點,并采用線性插值補全缺失數(shù)據(jù)。
 - 軌跡數(shù)據(jù)重構(gòu): 重新整理數(shù)據(jù)結(jié)構(gòu),確保數(shù)據(jù)的可解釋性。
 
Step 3: 數(shù)據(jù)特定清理
針對車隊跟馳場景,設(shè)定閾值去除異常數(shù)據(jù),以提高分析準確性。下圖展示了處理后的數(shù)據(jù)分布。其中分別代表車頭間距,車速,車速差,和加速度。

數(shù)據(jù)采集
結(jié)合作者所在課題組的數(shù)據(jù)方案和文獻,我們認為目前自動駕駛汽車的數(shù)據(jù)采集通常來自多種高精度傳感器的數(shù)據(jù)整合,包括LiDAR(激光雷達),*GPS(全球定位系統(tǒng)),DSRC(車載通信單元),高清攝像頭等。圖中顯示了作者課題組基于Lincoln MKZ的自動駕駛汽車測試平臺。

關(guān)鍵性能指標
為評估自動駕駛汽車的性能,我們采用以下性能指標:
- 安全性指標: Time-to-Collision ()。
 - 穩(wěn)定性指標: 加速度變化率()。
 - 可持續(xù)性指標: 燃油消耗()。
 - 通行效率指標: 車頭時距()。
 
分析結(jié)果如圖所示。

跟馳模型開發(fā)
最后,為了分析自動駕駛汽車的縱向行為,本研究探討了加速度與輸入變量(車頭間距、車速和車速差)之間的關(guān)系。下圖繪制了這些變量之間的散點圖,其中y軸是加速度,綠/黃/橙色圖片的橫軸分別代表車頭間距,車速,以及車速差??梢钥闯?,車頭間距和車速差對加速度的影響顯著,而加速度與車速之間無明顯線性關(guān)系。其中,加速度與車頭間距呈非線性正相關(guān),與車速差呈線性負相關(guān)。

結(jié)論
本研究回顧了多個自動駕駛軌跡數(shù)據(jù)集,并開發(fā)了統(tǒng)一自動駕駛縱向軌跡數(shù)據(jù)集,主要貢獻包括:
- 標準化縱向軌跡數(shù)據(jù)集 - 統(tǒng)一并清理不同數(shù)據(jù)源的數(shù)據(jù),提高數(shù)據(jù)可用性。
 - 高質(zhì)量的跟馳數(shù)據(jù)集 - 通過去噪和數(shù)據(jù)清理,保證數(shù)據(jù)分析的準確性。
 - 跟馳行為分析 - 研究加速度與輸入變量之間的非線性關(guān)系。
 
本文的連接和相關(guān)代碼、數(shù)據(jù)可以在以下鏈接里找到:
- Ultra-AV 數(shù)據(jù)集論文 - Scientific Data
 - GitHub 代碼倉庫 - Ultra-AV Dataset
 















 
 
 
















 
 
 
 