目錄
#論文想法
主要貢獻:
網路設計:
實驗結果:
總結:
引用:
首頁 科技週邊 人工智慧 進一步加速落地:壓縮自動駕駛端到端運動規劃模型

進一步加速落地:壓縮自動駕駛端到端運動規劃模型

Mar 16, 2024 pm 04:01 PM
模型 自動駕駛

原標題:On the Road to Portability: Compressing End-to-End Motion Planner for Autonomous Driving

論文連結:https://arxiv.org/pdf/2403.01238.pdf

程式碼連結:https://github.com/tulerfeng/PlanKD

作者單位:北京理工大學ALLRIDE.AI 河北省大數據科學與智慧技術重點實驗室

進一步加速落地:壓縮自動駕駛端到端運動規劃模型

#論文想法

端到端的運動規劃模型配備了深度神經網絡,在實現全自動駕駛方面展現出了巨大潛力。然而,過大的神經網路使得它們不適合部署在資源受限的系統上,這無疑需要更多的運算時間和資源。為了解決這個問題,知識蒸餾提供了一種有前景的方法,它透過使一個較小的學生模型從較大的教師模型學習來壓縮模型。儘管如此,如何應用知識蒸餾來壓縮運動規劃器到目前為止還未被探索。本文提出了 PlanKD,這是第一個為壓縮端到端運動規劃器量身定制的知識蒸餾框架。首先,考慮到駕駛場景本質上是複雜的,常常包含與規劃無關或甚至是噪音訊息,遷移這種資訊對學生規劃者並無益處。因此,本文設計了一種基於資訊瓶頸(information bottleneck)的策略,只蒸餾與規劃相關的訊息,而不是無差別地遷移所有資訊。其次,輸出規劃軌跡中的不同 waypoints 可能對運動規劃的重要性各不相同,某些關鍵 waypoints 的輕微偏差可能會導致碰撞。因此,本文設計了一個 safety-aware waypoint-attentive 的蒸餾模組,根據重要性為不同 waypoints 分配自適應權重,以鼓勵學生模型更準確地模仿更關鍵的 waypoints ,從而提高整體安全性。實驗表明,本文的 PlanKD 可以大幅提升小型規劃器的性能,並顯著減少它們的參考時間。

主要貢獻:

  1. 本文建構了第一個旨在探索專用知識蒸餾方法以壓縮自動駕駛中端到端運動規劃器的嘗試。
  2. 本文提出了一個通用且創新的框架 PlanKD,它使學生規劃器能夠繼承中間層中與規劃相關的知識,並促進關鍵waypoints 的準確匹配以提高安全性。
  3. 實驗表明,本文的 PlanKD 可以大幅提升小型規劃器的效能,為資源有限的部署提供了更便攜、更有效率的解決方案。

網路設計:

端對端運動規劃最近作為自動駕駛中的一個有前景的方向出現[3, 10, 30, 31, 40, 47, 48],它直接將原始感測器資料映射到規劃的動作上。這種基於學習的典範展現出減少對手動制定規則的嚴重依賴和減輕在複雜級聯模組(通常是檢測-追蹤-預測-規劃)[40, 48]內錯誤累積的優點。儘管取得了成功,但運動規劃器中深度神經網路龐大的架構為在資源受限環境中的部署帶來了挑戰,例如依賴邊緣設備運算能力的自動配送機器人。此外,即便是在常規車輛中,車載設備上的運算資源也經常是有限的[34]。因此,直接部署深層且龐大的規劃器不可避免地需要更多的運算時間和資源,這使得快速回應潛在危險變得具有挑戰性。為了緩解這個問題,一個直接的方法是透過使用較小的主幹網路來減少網路參數的數量,但本文觀察到,端到端規劃模型的效能會急劇下降,如圖1所示。例如,儘管當 InterFuser [33](典型的端對端運動規劃器)的參數數量從52.9M減少到26.3M時,推理時間降低了,但其駕駛得分也從53.44下降到了36.55。因此,有必要開發一種適用於端到端運動規劃的模型壓縮方法。

為了得到一個可攜帶的運動規劃器,本文採用知識蒸餾[19]來壓縮端對端運動規劃模型。知識蒸餾(KD)已在各種任務中被廣泛研究用於模型壓縮,例如目標檢測[6, 24]、語義分割[18, 28]等。這些工作的基本思想是透過從更大的教師模型繼承知識來訓練一個簡化的學生模型,並在部署期間使用學生模型來替代教師模型。雖然這些研究取得了顯著的成功,但直接將它們應用於端到端運動規劃會導致次優結果。這源自於運動規劃任務中固有的兩個新出現的挑戰:(i) 駕駛場景本質上是複雜的[46],涉及包括多個動態和靜態物體、複雜的背景場景以及多方面的道路和交通資訊在內的多樣化資訊。然而,並不是所有這些資訊都對規劃有益。例如,背景建築物和遠處的車輛對規劃來說是無關的甚至是噪音[41],而附近的車輛和交通燈則有確定性的影響。因此,自動地只從教師模型中提取與規劃相關的資訊至關重要,而以往的KD方法無法做到這一點。 (ii) 輸出規劃軌跡中的不同 waypoints 通常對運動規劃的重要性各不相同。例如,在導航一個交叉口時,軌跡中靠近其他車輛的 waypoints 可能比其他 waypoints 具有更高的重要性。這是因為在這些點,自車需要主動與其他車輛互動,即使是微小的偏差也可能導致碰撞。然而,如何自適應地確定關鍵 waypoints 並準確地模仿它們是以往KD方法的另一個重大挑戰。

為了解決上述兩個挑戰,本文提出了第一個為壓縮自動駕駛中端到端運動規劃器量身定制的知識蒸餾方法,稱為 PlanKD 。首先,本文提出了一個基於資訊瓶頸原理[2]的策略,其目標是提取包含最少且足夠規劃資訊的與規劃相關的特徵。具體來說,本文最大化提取的與規劃相關特徵和本文定義的規劃狀態的真值之間的互信息,同時最小化提取特徵和中間特徵映射之間的互信息。這項策略使本文能夠只在中間層提取關鍵的與規劃相關的信息,從而增強學生模型的有效性。其次,為了動態辨識關鍵 waypoints 並如實地模仿它們,本文採用注意力機制[38]計算每個 waypoints 及其在鳥瞰圖(BEV)中與關聯上下文之間的注意力權重。為了在蒸餾過程中促進對安全關鍵 waypoints 的準確模仿,本文設計了一個 safety-aware ranking loss ,鼓勵對於靠近移動障礙物的 waypoints 給予更高的注意力權重。相應地,學生規劃器的安全性可以顯著增強。如圖1所示的證據顯示,透過本文的 PlanKD,學生規劃器的駕駛得分可以顯著提高。此外,本文的方法可以將參考時間降低約50%,同時保持與教師規劃器在 Town05 Long Benchmark 上相當的效能。

進一步加速落地:壓縮自動駕駛端到端運動規劃模型

圖1. 在 Town05 Long Benchmark [31]上,隨著參數數量的減少,InterFuser[33] 效能下降的示意圖。透過利用本文的 PlanKD ,可以提升緊湊型運動規劃器的性能,並且顯著降低參考時間。推理時間在伺服器上的 GeForce RTX 3090 GPU 上進行評估。

進一步加速落地:壓縮自動駕駛端到端運動規劃模型

圖2. 本文的 PlanKD 框架示意圖。 PlanKD 由兩個模組組成:一個與規劃相關的特徵蒸餾模組,透過資訊瓶頸(IB)從中間特徵映射中提取與規劃相關的特徵;一個safety-aware waypoint-attentive 蒸餾模組,動態確定關鍵waypoints ,並從中提取知識以增強整體安全性。

實驗結果:

進一步加速落地:壓縮自動駕駛端到端運動規劃模型

圖3. 在不同駕駛場景下,safety-aware 注意力權重的視覺化。綠色塊代表自車(ego-vehicle),黃色塊代表其他道路使用者(例如汽車、自行車)。一個 waypoint 的顏色越紅,它的注意力權重就越高。

進一步加速落地:壓縮自動駕駛端到端運動規劃模型進一步加速落地:壓縮自動駕駛端到端運動規劃模型進一步加速落地:壓縮自動駕駛端到端運動規劃模型進一步加速落地:壓縮自動駕駛端到端運動規劃模型

總結:

本文提出了 PlanKD,這是一種為壓縮端到端運動規劃器量身定制的知識蒸餾方法。所提出的方法可以透過資訊瓶頸學習與規劃相關的特徵,以實現有效的特徵蒸餾。此外,本文設計了一個 safety-aware waypoint-attentive 蒸餾機制,以適應性地決定每個 waypoint 對 waypoint 蒸餾的重要性。廣泛的實驗驗證了本文方法的有效性,證明了 PlanKD 可以作為資源有限部署的便攜式和安全的解決方案。

引用:

Feng K, Li C, Ren D, et al. On the Road to Portability: Compressing End-to-End Motion Planner for Autonomous Driving[ J]. arXiv preprint arXiv:2403.01238, 2024.

以上是進一步加速落地:壓縮自動駕駛端到端運動規劃模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

全球最強開源 MoE 模型來了,中文能力比肩 GPT-4,價格僅 GPT-4-Turbo 的近百分之一 全球最強開源 MoE 模型來了,中文能力比肩 GPT-4,價格僅 GPT-4-Turbo 的近百分之一 May 07, 2024 pm 04:13 PM

想像一下,一個人工智慧模型,不僅擁有超越傳統運算的能力,還能以更低的成本實現更有效率的效能。這不是科幻,DeepSeek-V2[1],全球最強開源MoE模型來了。 DeepSeek-V2是一個強大的專家混合(MoE)語言模型,具有訓練經濟、推理高效的特點。它由236B個參數組成,其中21B個參數用於啟動每個標記。與DeepSeek67B相比,DeepSeek-V2效能更強,同時節省了42.5%的訓練成本,減少了93.3%的KV緩存,最大生成吞吐量提高到5.76倍。 DeepSeek是一家探索通用人工智

自動駕駛場景中的長尾問題怎麼解決? 自動駕駛場景中的長尾問題怎麼解決? Jun 02, 2024 pm 02:44 PM

昨天面試被問到了是否做過長尾相關的問題,所以就想著簡單總結一下。自動駕駛長尾問題是指自動駕駛汽車中的邊緣情況,即發生機率較低的可能場景。感知的長尾問題是目前限制單車智慧自動駕駛車輛運行設計域的主要原因之一。自動駕駛的底層架構和大部分技術問題已經解決,剩下的5%的長尾問題,逐漸成了限制自動駕駛發展的關鍵。這些問題包括各種零碎的場景、極端的情況和無法預測的人類行為。自動駕駛中的邊緣場景"長尾"是指自動駕駛汽車(AV)中的邊緣情況,邊緣情況是發生機率較低的可能場景。這些罕見的事件

AI顛覆數學研究!菲爾茲獎得主、華裔數學家領銜11篇頂刊論文|陶哲軒轉贊 AI顛覆數學研究!菲爾茲獎得主、華裔數學家領銜11篇頂刊論文|陶哲軒轉贊 Apr 09, 2024 am 11:52 AM

AI,的確正在改變數學。最近,一直十分關注這個議題的陶哲軒,轉發了最近一期的《美國數學學會通報》(BulletinoftheAmericanMathematicalSociety)。圍繞著「機器會改變數學嗎?」這個話題,許多數學家發表了自己的觀點,全程火花四射,內容硬核,精彩紛呈。作者陣容強大,包括菲爾茲獎得主AkshayVenkatesh、華裔數學家鄭樂雋、紐大電腦科學家ErnestDavis等多位業界知名學者。 AI的世界已經發生了天翻地覆的變化,要知道,其中許多文章是在一年前提交的,而在這一

替代MLP的KAN,被開源專案擴展到卷積了 替代MLP的KAN,被開源專案擴展到卷積了 Jun 01, 2024 pm 10:03 PM

本月初,來自MIT等機構的研究者提出了一種非常有潛力的MLP替代方法—KAN。 KAN在準確性和可解釋性方面表現優於MLP。而且它能以非常少的參數量勝過以更大參數量運行的MLP。例如,作者表示,他們用KAN以更小的網路和更高的自動化程度重現了DeepMind的結果。具體來說,DeepMind的MLP有大約300,000個參數,而KAN只有約200個參數。 KAN與MLP一樣具有強大的數學基礎,MLP基於通用逼近定理,而KAN基於Kolmogorov-Arnold表示定理。如下圖所示,KAN在邊上具

你好,電動Atlas!波士頓動力機器人復活,180度詭異動作嚇到馬斯克 你好,電動Atlas!波士頓動力機器人復活,180度詭異動作嚇到馬斯克 Apr 18, 2024 pm 07:58 PM

波士頓動力Atlas,正式進入電動機器人時代!昨天,液壓Atlas剛「含淚」退出歷史舞台,今天波士頓動力就宣布:電動Atlas上崗。看來,在商用人形機器人領域,波士頓動力是下定決心要跟特斯拉硬剛一把了。新影片放出後,短短十幾小時內,就已經有一百多萬觀看。舊人離去,新角色登場,這是歷史的必然。毫無疑問,今年是人形機器人的爆發年。網友銳評:機器人的進步,讓今年看起來像人類的開幕式動作、自由度遠超人類,但這真不是恐怖片?影片一開始,Atlas平靜地躺在地上,看起來應該是仰面朝天。接下來,讓人驚掉下巴

Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇 Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇 Apr 01, 2024 pm 07:46 PM

谷歌力推的JAX在最近的基準測試中表現已經超過Pytorch和TensorFlow,7項指標排名第一。而且測試並不是JAX性能表現最好的TPU上完成的。雖然現在在開發者中,Pytorch依然比Tensorflow更受歡迎。但未來,也許有更多的大型模型會基於JAX平台進行訓練和運行。模型最近,Keras團隊為三個後端(TensorFlow、JAX、PyTorch)與原生PyTorch實作以及搭配TensorFlow的Keras2進行了基準測試。首先,他們為生成式和非生成式人工智慧任務選擇了一組主流

nuScenes最新SOTA | SparseAD:稀疏查詢協助高效端對端自動駕駛! nuScenes最新SOTA | SparseAD:稀疏查詢協助高效端對端自動駕駛! Apr 17, 2024 pm 06:22 PM

寫在前面&出發點端到端的範式使用統一的框架在自動駕駛系統中實現多任務。儘管這種範式具有簡單性和清晰性,但端到端的自動駕駛方法在子任務上的表現仍然遠遠落後於單任務方法。同時,先前端到端方法中廣泛使用的密集鳥瞰圖(BEV)特徵使得擴展到更多模態或任務變得困難。這裡提出了一種稀疏查找為中心的端到端自動駕駛範式(SparseAD),其中稀疏查找完全代表整個駕駛場景,包括空間、時間和任務,無需任何密集的BEV表示。具體來說,設計了一個統一的稀疏架構,用於包括檢測、追蹤和線上地圖繪製在內的任務感知。此外,重

聊聊端到端與下一代自動駕駛系統,以及端到端自動駕駛的一些迷思? 聊聊端到端與下一代自動駕駛系統,以及端到端自動駕駛的一些迷思? Apr 15, 2024 pm 04:13 PM

最近一個月由於眾所周知的一些原因,非常密集地和業界的各種老師同學進行了交流。交流中必不可免的一個話題自然是端到端與火辣的特斯拉FSDV12。想藉此機會,整理當下這個時刻的一些想法和觀點,供大家參考和討論。如何定義端到端的自動駕駛系統,應該期望端到端解決什麼問題?依照最傳統的定義,端到端的系統指的是一套系統,輸入感測器的原始訊息,直接輸出任務關心的變數。例如,在影像辨識中,CNN相對於傳統的特徵提取器+分類器的方法就可以稱之為端到端。在自動駕駛任務中,輸入各種感測器的資料(相機/LiDAR

See all articles