實現高效逼真的超大規模城市渲染:聯合NeRF與特徵網格技術
純粹基於 MLP 的神經輻射場(NeRF)由於模型容量有限,在大規模場景模糊渲染中往往存在欠擬合現象。最近有研究者提出對場景進行地理劃分、並採用多個子NeRF,分別對每個區域進行建模,然而,這樣做帶來的問題是隨著場景的逐漸擴展,訓練成本和子NeRF 的數量呈線性擴大。
另一種解決方案是使用體素特徵網格表示,該方法計算效率高,可以自然地擴展到具有增加網格解析度的大場景。然而,特徵網格由於約束較少往往只能達到次優解,在渲染中產生一些雜訊偽影,特別是在具有複雜幾何和紋理的區域。在
本文中,來自香港中文大學、上海人工智慧實驗室等機構的研究者提出了一個新的框架,用來實現高保真渲染的城市(Ubran)場景,同時兼顧計算效率,入選CVPR 2023。該研究使用一個緊湊的多重解析度 ground 特徵平面表示來粗略地捕捉場景,並透過一個 NeRF 分支網路以位置編碼輸入來補充它,以聯合學習的方式進行渲染。這種方式整合了兩種方案的優點:在特徵網格表示的指導下,輕加權NeRF 足以呈現具有細節的逼真新視角;聯合優化的ground 特徵平面可以獲得進一步的細化,形成更精確、更緊湊的特徵空間,輸出更自然的渲染結果。
- #論文網址:https://arxiv.org/ pdf/2303.14001.pdf
- #專案首頁:https://city-super.github.io/gridnerf/
#下圖為此研究方法對真實世界Ubran 場景的範例結果,給人一種沉浸式城市漫遊體驗:
方法介紹
為了有效利用隱式神經表示重建大型城市場景,研究提出了一個雙分支模型架構,它採用統一的場景表示,集成了基於顯式體素網格和基於隱式的NeRF 方法,這兩種類型的表示可以互補。
首先在預訓練階段使用特徵網格對目標場景進行建模,從而粗糙地捕捉場景的幾何形狀和外觀。然後使用粗特徵網格,1) 引導 NeRF 點採樣,使其集中在場景表面周圍;2) 為 NeRF 的位置編碼提供關於場景幾何形狀和在採樣位置上的外觀額外特徵。在這樣的指導下,NeRF 可以在一個大大壓縮的取樣空間中有效地獲得更精細的細節。此外,由於粗層級的幾何圖形和外觀資訊被明確地提供給 NeRF,一個輕量級的 MLP 就足以學習從全局座標到體積密度和顏色值的映射。在第二個聯合學習階段,透過來自 NeRF 分支的梯度對粗特徵網格進行進一步優化,並對其進行規範化,從而在單獨應用時產生更準確和自然的渲染結果。
研究的核心是一個新的雙分支結構,即網格分支和 NeRF 分支。 1) 研究人員首先在預訓練階段捕捉特徵平面的金字塔場景,並透過淺MLP 渲染器(網格分支)對射線點進行粗略的採樣,並預測它們的輻射值,由體積積分像素顏色上的MSE損失監督。這一步產生一組資訊豐富的多解析度密度 / 外觀特徵平面。 2) 接下來,研究者進入共同學習階段,並進行更精細的抽樣。研究人員使用學習到的特徵網格來指導 NeRF 分支採樣,以集中在場景表面。透過在特徵平面上的雙線性內插法,推導出採樣點的網格特徵。然後將這些特徵與位置編碼連接,並輸入 NeRF 分支以預測體積密度和顏色。請注意,在聯合訓練過程中,網格分支的輸出仍然使用 ground 真實影像以及來自 NeRF 分支的精細渲染結果進行監督。
目标场景:在这项工作中,该研究使用新颖的网格引导神经辐射场执行大型城市场景渲染。下图左侧显示了一个大型城市场景的示例,它跨越 2.7km^2 的地面区域,由超过 5k 的无人机图像捕获。研究表明,基于 NeRF 方法渲染结果模糊且过度平滑且模型容量有限,而基于特征网格的方法在适应具有高分辨率特征网格的大规模场景时往往会显示嘈杂的伪影。该研究提出的双分支模型结合了两种方法的优点,并通过对现有方法的显着改进实现了逼真的新颖视图渲染。这两个分支都比各自的基线获得了显着增强。
实验
研究人员在下图和表格中报告了 baseline 的性能和研究人员的方法作对比。无论从定性和定量上看。在视觉质量和所有指标方面都可以观察到显著的改善。与纯粹的基于 MLP 的方法(NeRF 和 Mega-NeRF)相比,研究人员的方法揭示了更清晰的几何形状和更精细的细节。特别是由于 NeRF 的有限容量和光谱偏差,它总是不能模拟几何形状和颜色的快速变化,如操场上的植被和条纹。尽管像 Mega-NeRF 的 baseline 中显示的那样,在地理位置上将场景划分为小区域稍有帮助,但呈现的结果仍然显得过于平滑。相反,在学习特征网格的引导下,NeRF 的采样空间被有效地、大大地压缩到场景表面附近。从 ground 特征平面采样的密度和外观特征明确地表示了场景内容,如图 3 所示。尽管不那么准确,但它已经提供了信息丰富的局部几何图形和纹理,并鼓励 NeRF 的位置编码来收集缺失的场景细节。
下表 1 为定量结果:
图 6 可以观察到渲染保真度的快速提高:
了解更多内容,请参考原论文。
以上是實現高效逼真的超大規模城市渲染:聯合NeRF與特徵網格技術的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

從主畫面中刪除了重要內容並試圖將其取回?您可以透過多種方式將應用程式圖示放回螢幕。我們已經討論了您可以遵循的所有方法,並將應用程式圖示放回主畫面如何在iPhone中撤消從主畫面中刪除正如我們之前提到的,有幾種方法可以在iPhone上恢復此變更。方法1–替換應用程式庫中的應用程式圖示您可以直接從應用程式庫將應用程式圖示放置在主畫面上。步驟1–橫向滑動以尋找應用程式庫中的所有應用程式。步驟2–找到您先前刪除的應用程式圖示。步驟3–只需將應用程式圖示從主庫拖曳到主畫面上的正確位置即可。這是將應用程式圖

PHP中箭頭符號的作用及實踐應用在PHP中,箭頭符號(->)通常用於存取物件的屬性和方法。物件是PHP中物件導向程式設計(OOP)的基本概念之一,在實際開發中,箭頭符號在操作物件時發揮重要作用。本文將介紹箭頭符號的作用以及實踐應用,並提供具體的程式碼範例來幫助讀者更好地理解。一、箭頭符號的作用存取物件的屬性箭頭符號可以用來存取物件的屬性。當我們實例化一個對

Linuxtee命令是一個非常有用的命令列工具,它可以在不影響已有輸出的情況下,將輸出寫入檔案或將輸出送到另一個命令。在本文中,我們將深入探索Linuxtee命令的各種應用場景,從入門到精通。 1.基本用法首先,我們來看看tee指令的基本用法。 tee指令的語法如下:tee[OPTION]...[FILE]...該指令會從標準輸入讀取數據,並將數據

Go語言是一種由Google開發的開源程式語言,於2007年首次發布。它被設計成一種簡單易學、高效、並發性強的語言,受到越來越多開發者的青睞。本文將探討Go語言的優勢,並介紹一些適合Go語言的應用場景,同時給出具體的程式碼範例。優勢並發性強:Go語言內建支援輕量級執行緒-goroutine,能夠輕鬆實現並發程式設計。透過使用go關鍵字就可以啟動goroutin

Linux在雲端運算領域的廣泛應用隨著雲端運算技術的不斷發展和普及,Linux作為一種開源作業系統在雲端運算領域中發揮重要作用。由於其穩定性、安全性和靈活性,Linux系統被廣泛應用於各種雲端運算平台和服務中,為雲端運算技術的發展提供了堅實的基礎。本文將介紹Linux在雲端運算領域的廣泛應用,並給出具體的程式碼範例。一、Linux在雲端運算平台中的應用虛擬化技術虛擬化技術

MySQL時間戳記是十分重要的資料類型,它可以儲存日期、時間或日期加時間。在實際的開發過程中,合理地使用時間戳記可以提高資料庫操作的效率,並且方便進行時間相關的查詢和計算。本文將從MySQL時間戳記的功能、功能和應用場景等面向展開探討,並結合具體的程式碼範例來講解。一、MySQL時間戳記的功能與特性MySQL中有兩種類型的時間戳,一種是TIMESTAMP

1.首先我們點選小白點。 2、點選設備。 3、點擊更多。 4.點擊應用程式切換器。 5、將應用程式後台進行關閉即可。

隨著大型語言模型如GPT-4與機器人技術的結合日益緊密,人工智慧正逐漸走向現實世界。因此,與具身智能相關的研究也引起越來越多的關注。在許多研究計畫中,Google的"RT"系列機器人一直處於前沿地位,這一趨勢在近期開始加速(詳見《大模型正在重構機器人,GoogleDeepmind如何定義未來的具身智慧》)。去年7月,GoogleDeepMind推出了RT-2,這是全球第一個能夠控制機器人進行視覺-語言-動作(VLA)互動的模型。只要用對話的方式下達指令,RT-2就能在大量圖片中辨識出黴黴,並將一罐可樂送到她手中。如今,
