近日,智加科技團隊論文《DualBEV: Unifying Dual Veiw Transformation with Probabilistic Correspondences》入選歐洲電腦視覺國際會議(ECCV, European Conference on Computer Vision),ECCV是電腦視覺領域最具影響力和權威性的國際會議之一,與國際計算機視覺大會(ICCV)和計算機視覺與模式識別會議(CVPR)齊名,被譽為計算機視覺領域的“三大頂會”之一。 ECCV 每兩年舉辦一次,匯集了全球頂尖的研究人員和專家,展示和討論最前沿的研究成果和技術創新。
DualBEV:榜單上最佳BEV 視角轉換方法Bird's-Eye-View (BEV) 感知是當前自動駕駛感知乃至端到端技術的基石,其中視角轉換(View Transformation) 則是BEV 感知的核心模組,承擔將影像特徵(2D) 轉換到BEV 空間(3D) 的重任。目前主流的方案往往會在 3D-to-2D 或 2D-to-3D 的視角轉換方案間陷入兩難。
3D-to-2D 方案一般依賴 Transformer,在取得不錯性能的同時也帶來了大量的計算開銷。 2D-to-3D 雖然計算速度快,但是容易失去卡車場景關心的遠距離資訊。
針對這些問題,DualBEV 從蒙特卡洛的概念出發,透過對View Transformation 本質的思考,把View Transformation 的過程總結為構建採樣、計算權重,進而提出了一種通用的特徵轉換算法(Unified Feature Transformation )。該演算法首先從兩種方向建構採樣,透過三種機率測量的相乘對兩種不同方向建構的採樣統一進行評估,再透過預計算加速轉換過程,融合得到最終的 BEV 特徵。
通用特徵轉換演算法DualBEV 開創性地將 3D-to-2D 和 2D-to-3D 的視角轉換方案統一進了一套整體框架內,充分利用各自視角的優勢。在 nuScenes Detection Leaderboard 純視覺方案上以 63.4% NDS 取得了 SOTA 的結果。由於視角轉換模組使用了預計算技術,其計算時間僅為 Transformer 方案的 1/40,是榜單最佳視角轉換法。
透過高效的視角轉換和多視角資訊融合,DualBEV 建構的 BEV 特徵提供了精準的場景表徵和快速的計算方案,為端到端系統的開發提供了堅實的基礎。智加科技正積極推進 DualBEV 在端到端自動駕駛系統中的深度集成,充分發揮其優勢,進一步提升自動駕駛系統的整體性能。
技術賦能產品,開源合作共贏
DualBEV 進一步優化後的相關技術已應用於智加科技自主研發的前裝量產重卡自動駕駛系統智加領航 2.0 中。該系統開放了領航自動駕駛功能,具備極致安全、舒適省力、節能環保等優勢,可實現自主超車、靠邊停車、匯入預測以及部分施工規避等高級功能,支援在典型快遞快遞場景中「雙駕變單駕」以顯著降低駕駛疲勞度,並透過最高省油10% 實現節能減排。
目前裝配智加領航2.0 系統的智慧重卡K7+,已被中國郵政、中通快運、安能物流等頭部物流公司投入實際運營,覆蓋京津冀、長三角、珠三角等核心經濟區,持續賦能幹線物流產業數智化轉型。
此次論文成功入選 ECCV 並進行部分研究成果開源,不僅展示了智加科技在自動駕駛領域的科研及創新能力,也將助力行業標準化和互操作性的提升。智加科技希望透過創新、合作與分享,集中力量攻克關鍵技術難題,有效推動自動駕駛技術的迭代與突破,最終實現物流運輸產業「智慧、安全、環保」的高品質發展。
以上是智加科技論文DualBEV入選電腦視覺頂會ECCV的詳細內容。更多資訊請關注PHP中文網其他相關文章!