整理自動駕駛端到端規劃方法的綜述-人工智慧-PHP中文網

一、Woven Planet（豐田子公司）的方案：Urban Driver 2021

二、南洋理工大學方案一Conditional Predictive Behavior Planning with Inverse Reinforcement Learning 2023.04

三、英偉達方案：2023.02 Tree-structured Policy Planning with Learned Behavior Models

四、南洋理工大學&英偉達聯合2023年10月最新方案：DTPP: Differentiable Joint Conditional Prediction and Cost Evaluation for Tree Policy Planning in Autonomous Driving

總結

首頁

科技週邊

人工智慧

整理自動駕駛端到端規劃方法的綜述

王林

Oct 30, 2023 pm 02:45 PM

科技自動駕駛

本文為經自動駕駛之心公眾號授權轉載，轉載請聯絡原文出處

一、Woven Planet（豐田子公司）的方案：Urban Driver 2021

這篇文章雖然是21年的，但許多新的文章都以它為對比基線，因此也有必要了解其方法

整理自動駕駛端到端規劃方法的綜述

大概看了下，主要就是用Policy Gradients學習State->近期action的映射函數，有了這個映射函數，可以一步步推演出整個執行軌跡，最後loss就是讓這個推演給予的軌跡盡可能的接近專家軌跡。

效果應該當時還不錯，因此能成為各家新演算法的基線。

二、南洋理工大學方案一Conditional Predictive Behavior Planning with Inverse Reinforcement Learning 2023.04

整理自動駕駛端到端規劃方法的綜述

先使用規則列舉了多種行為，生成了10~30條軌跡。（未使用預測結果）
使用Condtional Prediction算出每條主車待選軌跡情況下的預測結果，然後使用IRL對待選軌跡評分。

其中Conditional Joint Prediction模型長這樣：

整理自動駕駛端到端規劃方法的綜述

這個方法基本上很讚的點就是利用了Conditional Joint Prediction可以很好的完成互動性的預測，使得演算法有一定的博弈能力。
但我個人認為演算法缺點是前邊只產生了10~30條軌跡，而且軌跡生成時沒考慮預測，而且最後會直接在IRL打分後，直接選用這些軌跡中的一條作為最終結果，比較容易出現10~30條在考慮預測後發現都不大理想的狀況。相當於要在瘸子裡邊挑將軍，挑出來的也還是瘸子。基於這個方案，再解決前邊待選樣本產生品質會是很不錯的路子

三、英偉達方案：2023.02 Tree-structured Policy Planning with Learned Behavior Models

#用規則樹狀採樣，一層一層的往後考慮，對每一層的每個子結點都產生一個conditional prediction，然後用規則對prediction結果和主車軌跡打分，並用一些規則把不合法的幹掉，然後，利用DP往後產生最優軌跡，DP思路有點類似apollo裡dp_path_optimizer，不過加了一個時間維度。

不過因為多了一個維度，這個後邊擴展次數多了之後，還是會出現解空間很大計算量過大的情況，當前論文裡寫的方法是到節點過多之後，隨機丟棄了一些節點來確保計算量可控（感覺意思是節點過多之後可能也是n層之後了，可能影響比較小了）

本文主要貢獻就是把一個連續解空間通過這種樹形採樣規則轉變一個馬可夫決策過程，然後再利用dp求解。

四、南洋理工大學&英偉達聯合2023年10月最新方案：DTPP: Differentiable Joint Conditional Prediction and Cost Evaluation for Tree Policy Planning in Autonomous Driving

#你看標題就感覺很Exciting：

一、Conditional Prediction確保了一定賽局效果
二、可導，能夠整個梯度回傳，讓預測與IRL一起訓練。也是能拼出一個端對端自動駕駛的必備條件
三、Tree Policy Planning，可能有一定的交互推演能力

#仔細看完，發現這篇文章資訊含量很高，方法很巧妙。

整理自動駕駛端到端規劃方法的綜述

經過對英偉達的TPP和南洋理工的Conditional Predictive Behavior Planning with Inverse Reinforcement Learning進行糅合改進，成功解決了之前南洋理工論文中待選軌跡不好的問題

論文方案的主要模組包括：

一、Conditional Prediction模組，輸入一條主車歷史軌跡提示軌跡障礙車歷史軌跡，給出主車接近提示軌蹟的預測軌跡和與主車行為自洽的障礙車的預測軌跡。
二、評分模組，能夠給一個主車障礙車軌跡打分看這個軌跡是否像專家的行為，學習方法是IRL。
三、Tree Policy Search模組，用來產生一堆待選軌跡

採用Tree Search演算法來探索主車的可行解，探索過程中每一步都將已經探索出來的軌跡作為輸入，利用Conditional Prediction演算法產生主車和障礙車的預測軌跡，並調用打分模組評估軌跡的優劣，從而影響下一步搜尋擴展節點的方向。透過這種方法，可以產生一些與其他方案不同的主車軌跡，並且在軌跡生成時考慮與障礙車之間的交互

傳統的IRL都是人工搞了一大堆的feature，如前後一堆障礙物在軌跡時間維度上的各種feature（如相對s, l和ttc之類的），本文裡為了讓模型可導，則是直接使用prediction的ego context MLP生成一個Weight數組( size = 1 * C)，隱式表徵了主車周圍的環境訊息，然後用MLP直接接把主車軌跡對應多模態預測結果轉成Feature數組(size = C * N, N指的待選軌跡數)，然後將兩個矩陣相乘得到最終軌跡評分。然後IRL讓專家得分最高。個人感覺這裡可能是為了計算效率，讓decoder盡可能簡單，還是有一定的主車信息丟失，如果不關注計算效率，可以用一些更複雜一些的網絡連接Ego Context和Predicted Trajectories，應該效果層面會更好？或者如果放棄可導性，這裡還是可以考慮再把人工設定的feature加進去，也應該可以提升模型效果。

在時間方面，該方案採用了一次重編碼多次輕量化解碼的方法，成功地減少了計算延遲。文章中指出，延遲可以壓縮到98毫秒

在learning based planner中屬於SOTA行列，閉迴路效果接近前一篇文章中提到的nuplan 排第一的Rule Based方案PDM。

總結

看下來，感覺這麼範式是挺不錯的思路，中間具體過程可以自己想辦法調整：

用預測模型指導一些規則來產生一些待選ego軌跡
對每個軌跡，用Conditional Joint Prediction做互動式預測，產生agent預測。可以提升博弈效能。
IRL等方法做利用Conditional Joint Prediction結果對前邊的主車軌跡評分，選出最優軌跡

整理自動駕駛端到端規劃方法的綜述

需要重新書寫的內容是：原文連結：https://mp.weixin.qq.com/s/ZJtMU3zGciot1g5BoCe9Ow

以上是整理自動駕駛端到端規劃方法的綜述的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7852

Java教學

1649

CakePHP 教程

1403

Laravel 教程

1300

PHP教程

1241

Related knowledge

為何在自動駕駛方面Gaussian Splatting如此受歡迎，開始放棄NeRF？ Jan 17, 2024 pm 02:57 PM

寫在前面&筆者的個人理解三維Gaussiansplatting（3DGS）是近年來在顯式輻射場和電腦圖形學領域出現的一種變革性技術。這種創新方法的特點是使用了數百萬個3D高斯，這與神經輻射場（NeRF）方法有很大的不同，後者主要使用隱式的基於座標的模型將空間座標映射到像素值。 3DGS憑藉其明確的場景表示和可微分的渲染演算法，不僅保證了即時渲染能力，而且引入了前所未有的控制和場景編輯水平。這將3DGS定位為下一代3D重建和表示的潛在遊戲規則改變者。為此我們首次系統性地概述了3DGS領域的最新發展與關

自動駕駛場景中的長尾問題怎麼解決？ Jun 02, 2024 pm 02:44 PM

昨天面試被問到了是否做過長尾相關的問題，所以就想著簡單總結一下。自動駕駛長尾問題是指自動駕駛汽車中的邊緣情況，即發生機率較低的可能場景。感知的長尾問題是目前限制單車智慧自動駕駛車輛運行設計域的主要原因之一。自動駕駛的底層架構和大部分技術問題已經解決，剩下的5%的長尾問題，逐漸成了限制自動駕駛發展的關鍵。這些問題包括各種零碎的場景、極端的情況和無法預測的人類行為。自動駕駛中的邊緣場景"長尾"是指自動駕駛汽車（AV）中的邊緣情況，邊緣情況是發生機率較低的可能場景。這些罕見的事件

選擇相機還是光達？實現穩健的三維目標檢測的最新綜述 Jan 26, 2024 am 11:18 AM

0.寫在前面&&個人理解自動駕駛系統依賴先進的感知、決策和控制技術，透過使用各種感測器（如相機、光達、雷達等）來感知周圍環境，並利用演算法和模型進行即時分析和決策。這使得車輛能夠識別道路標誌、檢測和追蹤其他車輛、預測行人行為等，從而安全地操作和適應複雜的交通環境。這項技術目前引起了廣泛的關注，並認為是未來交通領域的重要發展領域之一。但是，讓自動駕駛變得困難的是弄清楚如何讓汽車了解周圍發生的事情。這需要自動駕駛系統中的三維物體偵測演算法可以準確地感知和描述周圍環境中的物體，包括它們的位置、

Stable Diffusion 3論文終於發布，架構細節大揭秘，對復現Sora有幫助？ Mar 06, 2024 pm 05:34 PM

StableDiffusion3的论文终于来了！这个模型于两周前发布，采用了与Sora相同的DiT（DiffusionTransformer）架构，一经发布就引起了不小的轰动。与之前版本相比，StableDiffusion3生成的图质量有了显著提升，现在支持多主题提示，并且文字书写效果也得到了改善，不再出现乱码情况。StabilityAI指出，StableDiffusion3是一个系列模型，其参数量从800M到8B不等。这一参数范围意味着该模型可以在许多便携设备上直接运行，从而显著降低了使用AI

自動駕駛與軌跡預測看這篇就夠了！ Feb 28, 2024 pm 07:20 PM

軌跡預測在自動駕駛中承擔著重要的角色，自動駕駛軌跡預測是指透過分析車輛行駛過程中的各種數據，預測車輛未來的行駛軌跡。作為自動駕駛的核心模組，軌跡預測的品質對於下游的規劃控制至關重要。軌跡預測任務技術堆疊豐富，需熟悉自動駕駛動/靜態感知、高精地圖、車道線、神經網路架構（CNN&GNN&Transformer）技能等，入門難度很高！許多粉絲期望能夠盡快上手軌跡預測，少踩坑，今天就為大家盤點下軌跡預測常見的一些問題和入門學習方法！入門相關知識1.預習的論文有沒有切入順序？ A：先看survey，p

SIMPL：用於自動駕駛的簡單高效的多智能體運動預測基準 Feb 20, 2024 am 11:48 AM

原文標題：SIMPL:ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving論文連結：https://arxiv.org/pdf/2402.02519.pdf程式碼連結：https://github.com/HKUST-Aerial-Robotics/SIMPLobotics單位論文想法：本文提出了一種用於自動駕駛車輛的簡單且有效率的運動預測基線（SIMPL）。與傳統的以代理為中心(agent-cent

聊聊端到端與下一代自動駕駛系統，以及端到端自動駕駛的一些迷思？ Apr 15, 2024 pm 04:13 PM

最近一個月由於眾所周知的一些原因，非常密集地和業界的各種老師同學進行了交流。交流中必不可免的一個話題自然是端到端與火辣的特斯拉FSDV12。想藉此機會，整理當下這個時刻的一些想法和觀點，供大家參考和討論。如何定義端到端的自動駕駛系統，應該期望端到端解決什麼問題？依照最傳統的定義，端到端的系統指的是一套系統，輸入感測器的原始訊息，直接輸出任務關心的變數。例如，在影像辨識中，CNN相對於傳統的特徵提取器+分類器的方法就可以稱之為端到端。在自動駕駛任務中，輸入各種感測器的資料（相機/LiDAR

FisheyeDetNet：首個以魚眼相機為基礎的目標偵測演算法 Apr 26, 2024 am 11:37 AM

目標偵測在自動駕駛系統當中是一個比較成熟的問題，其中行人偵測是最早得以部署演算法之一。在多數論文當中已經進行了非常全面的研究。然而，利用魚眼相機進行環視的距離感知相對來說研究較少。由於徑向畸變大，標準的邊界框表示在魚眼相機當中很難實施。為了緩解上述描述，我們探索了擴展邊界框、橢圓、通用多邊形設計為極座標/角度表示，並定義一個實例分割mIOU度量來分析這些表示。所提出的具有多邊形形狀的模型fisheyeDetNet優於其他模型，並同時在用於自動駕駛的Valeo魚眼相機資料集上實現了49.5%的mAP

See all articles

整理自動駕駛端到端規劃方法的綜述

一、Woven Planet（豐田子公司）的方案：Urban Driver 2021

二、南洋理工大學方案一Conditional Predictive Behavior Planning with Inverse Reinforcement Learning 2023.04

三、英偉達方案：2023.02 Tree-structured Policy Planning with Learned Behavior Models

四、南洋理工大學&英偉達聯合2023年10月最新方案：DTPP: Differentiable Joint Conditional Prediction and Cost Evaluation for Tree Policy Planning in Autonomous Driving

總結

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題