社群

學習

工具庫

AI工具

休閒

繁体中文

目錄

写在前面&笔者的个人理解

详解Lightning NeRF

Preliminaries

Hybrid Scene Representation

#LiDAR Initialization

Color Decomposition

訓練損失

结论

首頁

科技週邊

人工智慧

為自動駕駛而生，Lightning NeRF：速度提升10倍

為自動駕駛而生，Lightning NeRF：速度提升10倍

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Mar 19, 2024 pm 06:19 PM

自動駕駛雷射

写在前面&笔者的个人理解

最近的研究强调了NeRF在自动驾驶环境中的应用前景。然而室外环境的复杂性，加上驾驶场景中的视点受限，使精确重建场景几何体的任务变得复杂。这些挑战往往会导致重建质量下降，训练和渲染的持续时间延长。为了应对这些挑战，我们推出了Lightning NeRF。它使用了一种高效的混合场景表示，在自动驾驶场景中有效地利用了激光雷达的几何先验。Lightning NeRF显著提高了NeRF的新颖视图合成性能，并减少了计算开销。通过对真实世界数据集（如KITTI-360、Argoverse2和我们的私人数据集）的评估，我们证明了我们的方法不仅在新视图合成质量方面超过了当前最先进的技术，而且在训练速度上提高了五倍，在渲染速度上也提高了十倍。

代码链接：https://github.com/VISION-SJTU/Lightning-NeRF

为自动驾驶而生，Lightning NeRF：速度提升10倍

详解Lightning NeRF

Preliminaries

为自动驾驶而生，Lightning NeRF：速度提升10倍

NeRF是一种表示具有隐式函数的场景的方法，这种隐式函数通常由MLP进行参数化。它能够根据观察方向d返回场景中3D点x的颜色值c和体积密度预测σ。

为自动驾驶而生，Lightning NeRF：速度提升10倍

为了呈现像素，NeRF使用分层体积采样沿着射线r生成一系列点，然后通过累积组合这些位置的预测密度和颜色特征。

为自动驾驶而生，Lightning NeRF：速度提升10倍

尽管NeRF在新视角合成方面表现出色，但它的长训练时间和慢渲染速度主要是由于采样策略效率低造成的。为了改善模型的效率，我们在训练过程中保持粗略的网格占用，并仅对占用体积内的位置进行采样。这种采样策略与现有工作类似，有助于提高模型的性能并加快训练速度。

Hybrid Scene Representation

混合体积表示已经使用紧凑的模型实现了快速优化和渲染。鉴于此，我们采用混合体素网格表示来对辐射场进行建模以提高效率。简言之，我们通过在网格顶点存储σ来显式地对体积密度进行建模，同时使用浅MLP以隐式方式将颜色嵌入f解码为最终颜色c。为了处理户外环境的无边界性质，我们将场景表示分为前景和背景两部分，如图2所示。具体来说，我们从轨迹序列中检查每一帧中的相机截头体，并定义前景边界框，使其紧密包裹对齐坐标系中的所有截头体。背景框是通过沿每个维度按比例放大前景框而获得的。

體素網格表示。體素網格表示在其網格頂點中明確儲存場景屬性（例如，密度、RGB顏色或特徵），以支援高效的特徵查詢。這樣，對於給定的3D位置，我們可以透過三線性插值來解碼對應的屬性：

为自动驾驶而生，Lightning NeRF：速度提升10倍

前景。我們建立了兩個獨立的特徵網格，用於對前景區域的密度和顏色嵌入進行建模。具體來說，密度網格映射將位置映射到密度標量σ中，用於體積渲染。對於顏色嵌入網格映射，我們透過哈希表以不同解析度備份實例化多個體素網格，以獲得更精細的細節，並具有可承受的記憶體開銷。最終的顏色嵌入f是透過在L個解析度層級上串聯輸出而獲得的。

背景儘管前面提到的前景建模適用於物件層級的輻射場，但將其擴展到無界的室外場景並非易事。一些相關技術，如NGP，直接擴展其場景邊界框，以便可以包括背景區域，而GANcraft和URF引入了球形背景輻射來處理這個問題。然而，前一種嘗試導致其功能的浪費，因為其場景框內的大多數區域都用於背景場景。對於後一種方案，它可能無法處理城市場景中複雜的全景（例如，起伏的建築或複雜的景觀），因為它只是假設背景輻射僅取決於視線方向。

為此，我們設定了一個額外的背景網格模型，以保持前景部分的解析度不變。我們採用[9]中的場景參數化作為背景，並經過精心設計。首先與反球面建模不同，我們使用反三次建模，用ℓ∞ 範數，因為我們使用體素網格表示。其次我們不實例化額外的MLP來查詢背景顏色以節省記憶體。具體來說，我們透過以下方式將3D背景點扭曲為4D:

为自动驾驶而生，Lightning NeRF：速度提升10倍

#LiDAR Initialization

使用我們的混合場景表示，當我們直接從有效的體素網格表示而不是計算密集型MLP查詢密度值時，模型可以節省計算和記憶體。然而，考慮到城市場景的大規模性質和複雜性，由於密度網格的分辨率有限，這種輕量級表示很容易在最佳化中陷入局部極小值。幸運的是，在自動駕駛中，大多數自動駕駛汽車（SDV）都配備了LiDAR感測器，為場景重建提供了粗略的幾何先驗。為此，我們建議使用雷射測距儀點雲來初始化我們的密度網格，以減輕場景幾何和輻射聯合優化的障礙。

Color Decomposition

最初的NeRF使用與視圖相關的MLP來對輻射場中的顏色進行建模，這是對物理世界的簡化，其中輻射由漫射（與視圖無關）顏色和鏡面（與視圖相關）顏色組成。此外，由於最終輸出顏色c與觀看方向d完全糾纏，因此難以在看不見的視圖中渲染高保真圖像。如圖3所示，我們在沒有顏色分解（CD）的情況下訓練的方法在外推設置中的新視圖合成中失敗（即，基於訓練視圖將觀看方向向左移動2米），而我們在顏色分解的情況下給出了合理的渲染結果。

为自动驾驶而生，Lightning NeRF：速度提升10倍

为自动驾驶而生，Lightning NeRF：速度提升10倍

取樣位置的最終顏色是這兩個因素的總和：

为自动驾驶而生，Lightning NeRF：速度提升10倍

訓練損失

我們使用重新縮放的權重wi來修改光度損失，以優化我們的模型，使其專注於硬樣本以實現快速收斂。權重係數定義為：

为自动驾驶而生，Lightning NeRF：速度提升10倍

为自动驾驶而生，Lightning NeRF：速度提升10倍

为自动驾驶而生，Lightning NeRF：速度提升10倍

为自动驾驶而生，Lightning NeRF：速度提升10倍

为自动驾驶而生，Lightning NeRF：速度提升10倍

为自动驾驶而生，Lightning NeRF：速度提升10倍

##實驗########################################## ######

结论

本文介绍了Lightning NeRF，这是一种高效的户外场景视图合成框架，它集成了点云和图像。所提出的方法利用点云快速初始化场景的稀疏表示，实现了显著的性能和速度增强。通过更有效地对背景进行建模，我们减少了前景上的代表性应变。最后，通过颜色分解，分别对视图相关和视图无关的颜色进行建模，增强了模型的外推能力。在各种自动驾驶数据集上进行的大量实验表明，我们的方法在性能和效率方面都优于以前的先进技术。

以上是為自動駕駛而生，Lightning NeRF：速度提升10倍的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

顯示更多

熱門文章

R.E.P.O.能量晶體解釋及其做什麼（黃色晶體）

3 週前 By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.最佳圖形設置

3 週前 By 尊渡假赌尊渡假赌尊渡假赌

刺客信條陰影：貝殼謎語解決方案

2 週前 By DDD

R.E.P.O.如果您聽不到任何人，如何修復音頻

3 週前 By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25：如何解鎖Myrise中的所有內容

4 週前 By 尊渡假赌尊渡假赌尊渡假赌

顯示更多

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

顯示更多

熱門話題

gmail信箱登陸入口在哪裡

7492

15

CakePHP 教程

1377

52

steam的賬戶名稱是什麼格式

77

11

win11激活密鑰永久

52

19

NYT連接提示和答案

19

41

顯示更多

Related knowledge

為何在自動駕駛方面Gaussian Splatting如此受歡迎，開始放棄NeRF？

為何在自動駕駛方面Gaussian Splatting如此受歡迎，開始放棄NeRF？ Jan 17, 2024 pm 02:57 PM

寫在前面&筆者的個人理解三維Gaussiansplatting（3DGS）是近年來在顯式輻射場和電腦圖形學領域出現的一種變革性技術。這種創新方法的特點是使用了數百萬個3D高斯，這與神經輻射場（NeRF）方法有很大的不同，後者主要使用隱式的基於座標的模型將空間座標映射到像素值。 3DGS憑藉其明確的場景表示和可微分的渲染演算法，不僅保證了即時渲染能力，而且引入了前所未有的控制和場景編輯水平。這將3DGS定位為下一代3D重建和表示的潛在遊戲規則改變者。為此我們首次系統性地概述了3DGS領域的最新發展與關

自動駕駛場景中的長尾問題怎麼解決？

自動駕駛場景中的長尾問題怎麼解決？ Jun 02, 2024 pm 02:44 PM

昨天面試被問到了是否做過長尾相關的問題，所以就想著簡單總結一下。自動駕駛長尾問題是指自動駕駛汽車中的邊緣情況，即發生機率較低的可能場景。感知的長尾問題是目前限制單車智慧自動駕駛車輛運行設計域的主要原因之一。自動駕駛的底層架構和大部分技術問題已經解決，剩下的5%的長尾問題，逐漸成了限制自動駕駛發展的關鍵。這些問題包括各種零碎的場景、極端的情況和無法預測的人類行為。自動駕駛中的邊緣場景"長尾"是指自動駕駛汽車（AV）中的邊緣情況，邊緣情況是發生機率較低的可能場景。這些罕見的事件

選擇相機還是光達？實現穩健的三維目標檢測的最新綜述

選擇相機還是光達？實現穩健的三維目標檢測的最新綜述 Jan 26, 2024 am 11:18 AM

0.寫在前面&&個人理解自動駕駛系統依賴先進的感知、決策和控制技術，透過使用各種感測器（如相機、光達、雷達等）來感知周圍環境，並利用演算法和模型進行即時分析和決策。這使得車輛能夠識別道路標誌、檢測和追蹤其他車輛、預測行人行為等，從而安全地操作和適應複雜的交通環境。這項技術目前引起了廣泛的關注，並認為是未來交通領域的重要發展領域之一。但是，讓自動駕駛變得困難的是弄清楚如何讓汽車了解周圍發生的事情。這需要自動駕駛系統中的三維物體偵測演算法可以準確地感知和描述周圍環境中的物體，包括它們的位置、

你是否真正掌握了座標系轉換？自動駕駛離不開的多感測器問題

你是否真正掌握了座標系轉換？自動駕駛離不開的多感測器問題 Oct 12, 2023 am 11:21 AM

一先導與重點文章主要介紹自動駕駛技術中幾種常用的座標系統，以及他們之間如何完成關聯與轉換，最終建構出統一的環境模型。這裡重點理解自車到相機剛體轉換(外參)，相機到影像轉換(內參)，影像到像素有單位轉換。 3d向2d轉換會有對應的畸變，平移等。重點：自車座標系相機機體座標系需要被重寫的是：平面座標系像素座標系難點：要考慮影像畸變，去畸變和加畸變都是在像平面上去補償二簡介視覺系統一共有四個座標系：像素平面座標系（u,v）、影像座標系（x,y）、相機座標系（）與世界座標系（）。每種座標系之間均有聯繫，

自動駕駛與軌跡預測看這篇就夠了！

自動駕駛與軌跡預測看這篇就夠了！ Feb 28, 2024 pm 07:20 PM

軌跡預測在自動駕駛中承擔著重要的角色，自動駕駛軌跡預測是指透過分析車輛行駛過程中的各種數據，預測車輛未來的行駛軌跡。作為自動駕駛的核心模組，軌跡預測的品質對於下游的規劃控制至關重要。軌跡預測任務技術堆疊豐富，需熟悉自動駕駛動/靜態感知、高精地圖、車道線、神經網路架構（CNN&GNN&Transformer）技能等，入門難度很高！許多粉絲期望能夠盡快上手軌跡預測，少踩坑，今天就為大家盤點下軌跡預測常見的一些問題和入門學習方法！入門相關知識1.預習的論文有沒有切入順序？ A：先看survey，p

SIMPL：用於自動駕駛的簡單高效的多智能體運動預測基準

SIMPL：用於自動駕駛的簡單高效的多智能體運動預測基準 Feb 20, 2024 am 11:48 AM

原文標題：SIMPL:ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving論文連結：https://arxiv.org/pdf/2402.02519.pdf程式碼連結：https://github.com/HKUST-Aerial-Robotics/SIMPLobotics單位論文想法：本文提出了一種用於自動駕駛車輛的簡單且有效率的運動預測基線（SIMPL）。與傳統的以代理為中心(agent-cent

nuScenes最新SOTA | SparseAD：稀疏查詢協助高效端對端自動駕駛！

nuScenes最新SOTA | SparseAD：稀疏查詢協助高效端對端自動駕駛！ Apr 17, 2024 pm 06:22 PM

寫在前面&出發點端到端的範式使用統一的框架在自動駕駛系統中實現多任務。儘管這種範式具有簡單性和清晰性，但端到端的自動駕駛方法在子任務上的表現仍然遠遠落後於單任務方法。同時，先前端到端方法中廣泛使用的密集鳥瞰圖（BEV）特徵使得擴展到更多模態或任務變得困難。這裡提出了一種稀疏查找為中心的端到端自動駕駛範式（SparseAD），其中稀疏查找完全代表整個駕駛場景，包括空間、時間和任務，無需任何密集的BEV表示。具體來說，設計了一個統一的稀疏架構，用於包括檢測、追蹤和線上地圖繪製在內的任務感知。此外，重

聊聊端到端與下一代自動駕駛系統，以及端到端自動駕駛的一些迷思？

聊聊端到端與下一代自動駕駛系統，以及端到端自動駕駛的一些迷思？ Apr 15, 2024 pm 04:13 PM

最近一個月由於眾所周知的一些原因，非常密集地和業界的各種老師同學進行了交流。交流中必不可免的一個話題自然是端到端與火辣的特斯拉FSDV12。想藉此機會，整理當下這個時刻的一些想法和觀點，供大家參考和討論。如何定義端到端的自動駕駛系統，應該期望端到端解決什麼問題？依照最傳統的定義，端到端的系統指的是一套系統，輸入感測器的原始訊息，直接輸出任務關心的變數。例如，在影像辨識中，CNN相對於傳統的特徵提取器+分類器的方法就可以稱之為端到端。在自動駕駛任務中，輸入各種感測器的資料（相機/LiDAR

See all articles