目錄
方法介紹
1)標籤的初始樣本選擇
2)增量選擇的準則設計
3)整體主動學習範式
實驗結果
本工作的一些結論
首頁 科技週邊 人工智慧 端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

Mar 13, 2024 pm 12:16 PM
端到端 自動駕駛

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

自動駕駛的端對端可微學習最近已成為一種突出的範式。一個主要瓶頸在於其對高品質標記資料的巨大需求,例如3D框和語義分割,這些資料的手動註釋成本是出了名的昂貴。由於AD中樣本內的行為往往存在長尾分佈這一突出事實,因此這一困難更加明顯。換言之,收集到的大部分數據可能微不足道(例如,在筆直的道路上向前行駛),只有少數情況是安全關鍵的。在本文中,我們探討了一個實際重要但未被充分探索的問題,即如何實現端到端AD的樣本和標籤效率。

具體而言,論文設計了一種面向規劃的主動學習方法,該方法根據所提出的規劃路線的多樣性和有用性標準,逐步註釋部分收集的原始資料。經驗上,所提出的計劃導向方法可以在很大程度上優於一般的主動學習方法。值得注意的是,方法僅使用30%的nuScenes數據,就實現了與最先進的端對端AD方法相當的效能。希望我們的工作能激勵未來的工作,從以數據為中心的角度,除了方法論的努力之外。

論文連結:https://arxiv.org/pdf/2403.02877.pdf

本文的主要貢獻:

  1. 第一個深入研究E2E-AD的數據問題的人。還提供了一個簡單而有效的解決方案,可以在有限的預算內識別和註釋有價值的數據,用於規劃。
  2. 基於端到端方法的規劃導向的哲學,為規劃路線設計了新的特定任務的多樣性和不確定性測量。
  3. 大量的實驗和消融研究證明了方法的有效性。 ActiveAD在很大程度上優於一般的對等方法,並且僅使用30%的nuScenes數據,實現了與具有完整標籤的SOTA方法相當的性能。

方法介紹

在端對端AD框架中詳細描述了ActiveAD,並根據AD的資料特徵設計了多樣性和不確定性指標。

1)標籤的初始樣本選擇

對於電腦視覺中的主動學習,初始樣本選擇通常僅基於原始圖像,而沒有額外的資訊或學習到的特徵,這導致了隨機初始化的常見做法。對於AD,還有其他先前的資訊可供利用。具體來說,當從感測器收集數據時,可以同時記錄傳統訊息,如自車的速度和軌跡。此外,天氣和照明條件通常是連續的,並且易於在片段層級中進行註釋。這些資訊有利於為初始集合選擇做出明智的選擇。因此,我們為初始選擇設計了自我多樣性測量。

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

Ego Diversity:由三個部分組成:1)天氣照明2)駕駛指令3)平均速度。首先使用nuScenes中的描述,將完整的資料集分割成四個互斥子集:Day Sunny(DS)、Day Rainy(DR)、Night Sunny(NS)、NightRainy(NR)。其次,根據一個完整片段中左、右和直行駕駛指令的數量將每個子集分為四類:左轉(L)、右轉(R)、超車(O)、直行(S)。論文設計了一個閾值τc,其中如果剪輯中左右命令的數量都大於或等於閾值τc時,我們將其視為該剪輯中的超越行為。如果只有向左指令的數量大於閾值τc,則表示左轉。如果只有向右指令的數量大於閾值τc,則表示向右轉。所有其它情況都被認為是直接的。第三,計算每個場景中的平均速度,並在相關的子集中按升序對它們進行排序。

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

#圖2給出了基於多路樹的初始選擇過程的詳細直覺過程。

2)增量選擇的準則設計

在本節將介紹如何基於使用已註釋片段訓練的模型,對片段的新部分進行增量註釋。我們將使用中間模型對未標記的片段進行推理,隨後的選擇是基於這些輸出。儘管如此,還是採取了規劃導向的觀點,並介紹了後續資料選擇的三個標準:位移誤差、軟碰撞和代理不確定性。

標準一:位移誤差(DE)。將表示為模型的預測規劃路線τ與資料集中記錄的人類軌跡τ*之間的距離。

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

其中T表示場景中的幀。由於位移誤差本身是一個性能指標(無需註釋),因此它自然成為主動選擇中的第一個也是最關鍵的標準。

標準二:軟碰撞(SC)。將LSC定義為預測的自車軌跡和預測的agent軌跡之間的距離。將透過閾值ε過濾掉低置信度agent預測。在每個場景中,選擇最短距離作為危險係數的量測。同時,在term和最近距離之間保持正相關:

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

使用“軟碰撞”作為一個標準,因為:一方面,與“置換誤差”不同,“碰撞比率」的計算取決於目標的3D框的註釋,而這些註釋在未標記的資料中不可用。因此,應該能夠僅根據模型的推理結果來計算標準。另一方面,考慮一個硬碰撞標準:如果預測的自車軌跡會與其他預測的agent的軌跡發生碰撞,將其指定為1,否則指定為0。然而,這可能會導致標籤為1的樣本太少,因為AD中最先進模型的碰撞率通常很小(低於1%)。因此,選擇使用與其他對目標最近的距離來代替“碰撞率”度量。當與其他車輛或行人的距離太近時,風險被認為要高得多。簡言之,「軟碰撞」是衡量碰撞可能性的有效指標,可以提供密集的監督。

標準III:agent不確定性(AU)。對周圍agent的未來軌蹟的預測自然具有不確定性,因此運動預測模組通常會產生多個模態和相應的置信度得分。我們的目標是選擇那些附近agent具有高度不確定性的資料。具體來說,透過距離閾值δ過濾出遙遠的主體,並計算剩餘主體的多種模式的預測機率的加權熵。假設模態的數量是,且agent在不同模態下的置信度得分是Pi(a),其中i∈{1,…,Nm}。然後,Agent不確定性可以定義為:

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

Overall Loss:

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

3)整體主動學習範式

Alg1介紹了方法的整個工作流程。給定可用預算B、初始選擇大小n0、在每個步驟中進行的活動選擇的數量ni以及總共M個選擇階段。首先使用上述描述的隨機化或自車多樣性方法初始化選擇。然後,使用目前註釋的資料來訓練網路。基於訓練的網絡,我們對未標記的進行預測,併計算總損失。最後根據總體損失對樣本進行排序,並選擇當前迭代中要註釋的前ni個樣本。重複這個過程,直到迭代達到上限M,並且所選的樣本數達到上限B。

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

實驗結果

在廣泛使用的nuScenes資料集上進行了實驗。所有實驗都使用PyTorch實現,並在RTX 3090和A100 GPU上運行。

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

表1:規劃表現。 ActiveAD在所有註解budget設定中都優於一般的主動學習基線。此外,與使用整個資料集進行訓練相比,具有30%資料的ActiveAD實現了略好的規劃效能。帶有*的VAD表示已經更新了結果,這些結果比原始工作中報告的結果要好。帶有†的UniAD表示已使用VAD的指標來更新結果。

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

表2:設計消融實驗。 “RA”和“ED”表示基於隨機性和自車多樣性的初始集選擇。 “DE”、“SC”和“AU”表示位移誤差, 分別為軟碰撞和agent不確定性。所有帶有“ED”的組合都使用相同的10%資料進行初始化。 LDE、LSC和LAU分別歸一化為[0,1],將超參數α和β設為1。

圖3:所選場景視覺化。根據所選的前置相機影像是基於在10%資料上訓練的模型的位移誤差(col 1)、軟碰撞(col 2)、agent不確定性(col 3)和混合(col 4)標準。 Mixed代表了我們的最終選擇策略ActiveAD,並考慮了前三種情況!

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

表4,各種場景下的效能。在各種天氣/照明和駕駛命令條件下,使用30%數據的活動模型的平均L2(m)/平均碰撞率(%)越小,性能越好。

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!

圖4:多個標準之間的相似性。它顯示了透過四個標準選擇10%(左)和20%(右)的新採樣場景:位移誤差(DE)、軟碰撞(SC)、代理不確定性(AU)和混合(MX)

本工作的一些結論

為了解決端到端自動駕駛資料標註的高成本和長尾問題,率先開發了量身定制的主動學習方案ActiveAD。 ActiveAD基於規劃導向的哲學,引入了新的任務特定的多樣性和不確定性測量。大量實驗證明了方法的有效性,僅使用30%的數據,就顯著超過了一般的往期方法,並實現了與最先進模型相當的性能。這代表著從以數據為中心的角度對端到端自動駕駛的一次有意義的探索,並希望我們的工作能啟發未來的研究和發現。

#

以上是端到端沒有資料怎麼辦? ActiveAD:面向規劃的端對端自動駕駛主動學習!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

為何在自動駕駛方面Gaussian Splatting如此受歡迎,開始放棄NeRF? 為何在自動駕駛方面Gaussian Splatting如此受歡迎,開始放棄NeRF? Jan 17, 2024 pm 02:57 PM

寫在前面&筆者的個人理解三維Gaussiansplatting(3DGS)是近年來在顯式輻射場和電腦圖形學領域出現的一種變革性技術。這種創新方法的特點是使用了數百萬個3D高斯,這與神經輻射場(NeRF)方法有很大的不同,後者主要使用隱式的基於座標的模型將空間座標映射到像素值。 3DGS憑藉其明確的場景表示和可微分的渲染演算法,不僅保證了即時渲染能力,而且引入了前所未有的控制和場景編輯水平。這將3DGS定位為下一代3D重建和表示的潛在遊戲規則改變者。為此我們首次系統性地概述了3DGS領域的最新發展與關

自動駕駛場景中的長尾問題怎麼解決? 自動駕駛場景中的長尾問題怎麼解決? Jun 02, 2024 pm 02:44 PM

昨天面試被問到了是否做過長尾相關的問題,所以就想著簡單總結一下。自動駕駛長尾問題是指自動駕駛汽車中的邊緣情況,即發生機率較低的可能場景。感知的長尾問題是目前限制單車智慧自動駕駛車輛運行設計域的主要原因之一。自動駕駛的底層架構和大部分技術問題已經解決,剩下的5%的長尾問題,逐漸成了限制自動駕駛發展的關鍵。這些問題包括各種零碎的場景、極端的情況和無法預測的人類行為。自動駕駛中的邊緣場景"長尾"是指自動駕駛汽車(AV)中的邊緣情況,邊緣情況是發生機率較低的可能場景。這些罕見的事件

選擇相機還是光達?實現穩健的三維目標檢測的最新綜述 選擇相機還是光達?實現穩健的三維目標檢測的最新綜述 Jan 26, 2024 am 11:18 AM

0.寫在前面&&個人理解自動駕駛系統依賴先進的感知、決策和控制技術,透過使用各種感測器(如相機、光達、雷達等)來感知周圍環境,並利用演算法和模型進行即時分析和決策。這使得車輛能夠識別道路標誌、檢測和追蹤其他車輛、預測行人行為等,從而安全地操作和適應複雜的交通環境。這項技術目前引起了廣泛的關注,並認為是未來交通領域的重要發展領域之一。但是,讓自動駕駛變得困難的是弄清楚如何讓汽車了解周圍發生的事情。這需要自動駕駛系統中的三維物體偵測演算法可以準確地感知和描述周圍環境中的物體,包括它們的位置、

你是否真正掌握了座標系轉換?自動駕駛離不開的多感測器問題 你是否真正掌握了座標系轉換?自動駕駛離不開的多感測器問題 Oct 12, 2023 am 11:21 AM

一先導與重點文章主要介紹自動駕駛技術中幾種常用的座標系統,以及他們之間如何完成關聯與轉換,最終建構出統一的環境模型。這裡重點理解自車到相機剛體轉換(外參),相機到影像轉換(內參),影像到像素有單位轉換。 3d向2d轉換會有對應的畸變,平移等。重點:自車座標系相機機體座標系需要被重寫的是:平面座標系像素座標系難點:要考慮影像畸變,去畸變和加畸變都是在像平面上去補償二簡介視覺系統一共有四個座標系:像素平面座標系(u,v)、影像座標系(x,y)、相機座標系()與世界座標系()。每種座標系之間均有聯繫,

自動駕駛與軌跡預測看這篇就夠了! 自動駕駛與軌跡預測看這篇就夠了! Feb 28, 2024 pm 07:20 PM

軌跡預測在自動駕駛中承擔著重要的角色,自動駕駛軌跡預測是指透過分析車輛行駛過程中的各種數據,預測車輛未來的行駛軌跡。作為自動駕駛的核心模組,軌跡預測的品質對於下游的規劃控制至關重要。軌跡預測任務技術堆疊豐富,需熟悉自動駕駛動/靜態感知、高精地圖、車道線、神經網路架構(CNN&GNN&Transformer)技能等,入門難度很高!許多粉絲期望能夠盡快上手軌跡預測,少踩坑,今天就為大家盤點下軌跡預測常見的一些問題和入門學習方法!入門相關知識1.預習的論文有沒有切入順序? A:先看survey,p

SIMPL:用於自動駕駛的簡單高效的多智能體運動預測基準 SIMPL:用於自動駕駛的簡單高效的多智能體運動預測基準 Feb 20, 2024 am 11:48 AM

原文標題:SIMPL:ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving論文連結:https://arxiv.org/pdf/2402.02519.pdf程式碼連結:https://github.com/HKUST-Aerial-Robotics/SIMPLobotics單位論文想法:本文提出了一種用於自動駕駛車輛的簡單且有效率的運動預測基線(SIMPL)。與傳統的以代理為中心(agent-cent

聊聊端到端與下一代自動駕駛系統,以及端到端自動駕駛的一些迷思? 聊聊端到端與下一代自動駕駛系統,以及端到端自動駕駛的一些迷思? Apr 15, 2024 pm 04:13 PM

最近一個月由於眾所周知的一些原因,非常密集地和業界的各種老師同學進行了交流。交流中必不可免的一個話題自然是端到端與火辣的特斯拉FSDV12。想藉此機會,整理當下這個時刻的一些想法和觀點,供大家參考和討論。如何定義端到端的自動駕駛系統,應該期望端到端解決什麼問題?依照最傳統的定義,端到端的系統指的是一套系統,輸入感測器的原始訊息,直接輸出任務關心的變數。例如,在影像辨識中,CNN相對於傳統的特徵提取器+分類器的方法就可以稱之為端到端。在自動駕駛任務中,輸入各種感測器的資料(相機/LiDAR

FisheyeDetNet:首個以魚眼相機為基礎的目標偵測演算法 FisheyeDetNet:首個以魚眼相機為基礎的目標偵測演算法 Apr 26, 2024 am 11:37 AM

目標偵測在自動駕駛系統當中是一個比較成熟的問題,其中行人偵測是最早得以部署演算法之一。在多數論文當中已經進行了非常全面的研究。然而,利用魚眼相機進行環視的距離感知相對來說研究較少。由於徑向畸變大,標準的邊界框表示在魚眼相機當中很難實施。為了緩解上述描述,我們探索了擴展邊界框、橢圓、通用多邊形設計為極座標/角度表示,並定義一個實例分割mIOU度量來分析這些表示。所提出的具有多邊形形狀的模型fisheyeDetNet優於其他模型,並同時在用於自動駕駛的Valeo魚眼相機資料集上實現了49.5%的mAP

See all articles