當前位置: 華文星空 > 汽車

ECCV2022|自動駕駛|ST

2022-07-19汽車

論文地址:ST-P3: End-to-end Vision-based Autonomous Driving via Spatial-Temporal Feature Learning

程式碼倉庫:https:// github.com/OpenPercepti onX/ST-P3

引言

最近在學習ECCV2022自動駕駛方面的工作,看到一篇有意思的文章(如題),看到這個P3(perception,predict,planning) 聰明的你大概明白了主要的工作,類似的工作還有MP3,而這個ST是時空(Spatial-Temporal)特征的含義。論文的工作很豐富,但是我還是想先提一下論文存在的問題。

問題1:表述存在問題

如下圖,原文表述子圖b是預測之後的地圖表示,但依我的經驗看,該圖應該是nuScenes數據集map介面渲染的標簽結果,不是完全真實推理的預測結果。這部份應該是作者的筆誤(推測)

問題2 :缺少forward時間方面的消融實驗

論文中借鑒了fiery中的關於future prediction的工作,但實際情況是,因為這部份模組的存在,在計算時間方面不具備優勢,甚至很難真正的上車使用。所以,可以推斷ST-P3的時間方面應該不是論文的亮點,但還是希望能在時間方面做一個消融實驗,以便大家能更全面的了解演算法的效能。

論文的主要工作

perception: 為了更好的進行時空特征融合,提出egocentric aligned accumulation,先進行lift將2d->3d然後再目標特征的對齊。

prediction :預測模組融合了兩路資訊,一路是t時刻的障礙物,另外一個是t-n時刻的障礙物位置,透過GRU單元進行特征融合從而進行障礙的預測。這個模組應該很影響演算法的執行效率。

Planning :以規則和模型學習兩種演算法為基礎,確定路徑規劃的代價函數,並透過前檢視的特征提取進行模型學習,完成軌跡最佳化。

論文的超參數:

backbone:EfficientNet-B4

head net: resnet18

硬件:4張v100

bev分辨率:以自車為中心上下左右50米(nuScenes);以自車為中心上下左右20米(carla);

損失函數的定義:

實驗部份:

實驗1:在nuScenes數據集上的開環實驗

開環應該指的是perception,predict,planning三個模組針對性的演算法驗證過程。

從這個perception結果上來看,提升確實不夠明顯,畢竟一頓操作後。但是整體看來,工作還是有效的。

實驗2:在carla仿真環境下的閉環實驗

閉環我推測指的是整個系統端到端的實驗。

總結:

論文整體工作豐富,但是還存在一些問題,瑕不掩瑜,還是得感謝作者的工作。也希望大家在看完論文後能就上述兩個問題留言討論,我的各人見解不一定準確。

往期回顧:

自動駕駛開發者說|前沿|ECCV2022有哪些自動駕駛方面的工作?

自動駕駛開發者說| 前沿 | CVPR2022有哪些自動駕駛方面的工作?

自動駕駛開發者說| 求職 | 2022年如何找到優秀的自動駕駛公司?

自動駕駛開發者說|技術棧|入門感知模組需要儲備哪些知識?

自動駕駛開發者說|前沿|基於BEV的自動駕駛會顛覆現有的自動駕駛架構嗎?

自動駕駛開發者說 | 前沿|如何定義&檢測&解決Corner Cases?

自動駕駛開發者說| 前沿 | 2022年ViT(vision transform)如何套用在自動駕駛任務上?

自動駕駛開發者說| 前沿 | 近兩年有哪些ViT(Vision Transformer)的改進演算法?

自動駕駛開發者說 | 前沿|如何進行LiDAR-Camera(雷達-相機)的聯合標定?

自動駕駛開發者說|前沿|如何用360度全景圖來深度估計?

自動駕駛開發者說|前沿|如何進行多傳感器的融合?

自動駕駛開發者說| 前沿 |如何利用ViT(vision transformer)進行全景影像的分割?

自動駕駛開發者說|前沿|如何結合深度資訊進行道路區域分割?

自動駕駛開發者說|數據集|CVPR2022有哪些數據集方面的工作(一)

自動駕駛開發者說 | 數據集 | 如何使用KITTI數據?

自動駕駛開發者說|高精地圖(1)|如何采集處理高精地圖的原始數據?

自動駕駛開發者說| 仿真 | 如何利用開源的自動駕駛仿真環境?

自動駕駛開發者說|仿真|如何安裝配置lgsvl-apollo聯調環境?

自動駕駛開發者說|框架|如何用vscode偵錯apollo?

自動駕駛開發者說|框架|如何單獨執行apollo相機感知模組?

自動駕駛開發者說|框架|如何找到apollo感知模組的爽點?

自動駕駛開發者說| 框架 |如何快準狠的安裝apollo6.0?

自動駕駛開發者說|框架|如何在apollo中添加自己的USB網絡攝影機?

自動駕駛開發者說|框架|如何理解Apollo感知模組的配置檔?

自動駕駛開發者說|行業|如何看待特斯拉傳感器的部署?

自動駕駛開發者說|行業|如何看待無人駕駛汽車的發展?

自動駕駛開發者說| 工具 |如何快速上手&運用ROS1?

CVPR2022 |自動駕駛|BEV感知|Cross-view Transformers for real-time Map-view Semantic Segmentation

CVPR2022 |目標檢測-多模態|CAT-Det: Contrastively Augmented Transformer for Multi-modal 3D Object Detection

CVPR2022 |自動駕駛 | 軌跡預測|Forecasting from LiDAR via Future Object Detection

CVPR2022|自動駕駛 | 極端天氣點雲檢測 | LiDAR Snowfall Simulation for Robust 3D Object Detection