目錄
論文概覽
方法介紹
首頁 科技週邊 人工智慧 4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

Oct 19, 2023 pm 02:21 PM
ai 模型

當 4K 畫質、60 幀影片在某些 APP 上還只能開會員觀看時,AI 研究者已經把 3D 動態合成影片做到了 4K 級別,而且畫面相當流暢。

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

在現實生活中,我們接觸的大多數影片都是 2D 的。在觀看這種影片時,我們是沒有辦法選擇觀看視角的,例如走到演員中間,或是走到空間的某個角落。 VR、AR 設備的出現彌補了這一缺陷,它們提供的 3D 影片允許我們變換視角、甚至隨意走動,沉浸感大大提升。

但是,這種 3D 動態場景的合成一直是個難點,無論是在畫質上還是流暢度上。

最近,來自浙江大學、像衍科技和螞蟻集團的研究者對這個問題發起了挑戰。在一篇題為「4K4D: Real-Time 4D View Synthesis at 4K Resolution」的論文中,他們提出了一種名為4K4D的點雲表示方法,大大提升了高解析度3D動態場景合成的渲染速度。具體來說,使用 RTX 4090 GPU,他們的方法能以 4K 解析度進行渲染,幀率可達80 FPS;以1080p解析度進行渲染時,幀率可達400FPS。整體來看,它的速度是以前方法的30多倍,而且渲染品質達到了SOTA。

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

以下是論文簡介。

論文概覽

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍


  • ##論文連結:https://arxiv.org/pdf/2310.11448.pdf

專案連結:https://zju3dv.github.io/4k4d/

動態視圖合成旨在從捕獲的影片中重建動態3D 場景,並建立沉浸式虛擬回放,這是電腦視覺和電腦圖形學中長期研究的問題。這種技術實用性的關鍵在於它能夠以高保真度即時渲染,使其能夠應用於 VR/AR、體育廣播和藝術表演捕捉。傳統方法將動態 3D 場景表示為紋理網格序列,並使用複雜的硬體進行重建。因此,它們通常僅限於受控環境。

最近,隱式神經表示在透過可微渲染從 RGB 視訊重建動態 3D 場景方面取得了巨大成功。例如《Neural 3d video synthesis from multi-view video》將目標場景建模為動態輻射場,利用體渲染合成影像,並與輸入影像進行對比最佳化。儘管動態視圖合成結果令人印象深刻,但由於網路評估昂貴,現有方法通常需要幾秒鐘甚至幾分鐘才能以 1080p 解析度渲染一張影像。

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

###受靜態視圖合成方法的啟發,一些動態視圖合成方法透過降低網路評估的成本或次數來提高渲染速度。透過這些策略,MLP Maps 能夠以 41.7 fps 的速度渲染前景動態人物。然而,渲染速度的挑戰仍然存在,因為 MLP  Maps 的即時效能只有在合成中等解析度(384×512)的影像時才能實現。當渲染 4K 解析度的影像時,它的速度降低到只有 1.3 FPS。 ############在這篇論文中,研究者提出了新的神經表示 ——4K4D,用於建模和渲染動態 3D 場景。如圖 1 所示,4K4D 在渲染速度上明顯優於先前的動態視圖合成方法,同時在渲染品質上具有競爭力。 ################

作者表示,他們的核心創新在於 4D 點雲表示和混合外觀模型。具體而言,對於動態場景,他們使用空間雕刻演算法來獲得粗點雲序列,並將每個點的位置建模為可學習向量。他們還引入 4D 特徵網格,為每個點分配特徵向量,並將其輸入 MLP 網絡,以預測點的半徑、密度和球諧函數(SH)係數。 4D 特徵網格自然地在點雲上應用了空間正則化,使得最佳化更加穩健。基於 4K4D,研究者開發了一種可微深度剝離演算法,利用硬體光柵化實現前所未有的渲染速度。

研究者發現,基於 MLP 的 SH 模型難以表示動態場景的外觀。為了緩解這個問題,他們還引入了一個影像混合模型來與 SH 模型結合,以表示場景的外觀。一個重要的設計是,他們使圖像混合網路獨立於觀看方向,因此可以在訓練後預先計算,以提高渲染速度。作為一把雙刃劍,該策略使影像混合模型沿著觀看方向離散。使用連續 SH 模型可以彌補這個問題。與僅使用 SH 模型的 3D Gaussian Splatting 相比,研究者提出的混合外觀模型充分利用了輸入影像擷取的信息,從而有效地提高了渲染品質。

為了驗證新方法的有效性,研究者在多個廣泛使用的多視圖動態新視圖合成資料集上評估了4K4D,包括NHR、ENeRF-Outdoo、DNA- Rendering 和Neural3DV。廣泛的實驗表明,4K4D 不僅渲染速度快了幾個數量級,而且在渲染品質方面也明顯優於 SOTA 技術。使用 RTX 4090 GPU,新方法在 DNA-Rendering 資料集上達到 400 FPS,解析度為 1080p;在 ENeRF-Outdoor 資料集上達到 80 FPS,解析度為 4k。

方法介紹

給定捕獲動態 3D 場景的多視圖視頻,本文旨在重建目標場景並即時地進行視圖合成。模型架構圖如圖2 所示:

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

接著文中介紹了用點雲建模動態場景的相關知識,他們從4D 嵌入、幾何模型以及外觀模型等角度展開。

4D 嵌入:給定目標場景的粗點雲,本文使用神經網路和特徵網格表示其動態幾何和外觀。具體來說,本文首先定義了六個特徵平面θ_xy、θ_xz、θ_yz、θ_tx、θ_ty 和θ_tz,並採用K-Planes 策略,利用這六個平面來建模一個4D 特徵場Θ(x, t):

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

幾何模型:基於粗點雲,動態場景幾何結構透過學習每個點上的三個屬性( entries)來表示,即位置p ∈ R^3 、半徑r ∈ R 和密度σ ∈ R。然後藉助這些點,計算空間點 x 的體積密度。點位置 p 被建模為可最佳化的向量。透過將 Eq.(1) 中的特徵向量 f 饋送到 MLP 網路中來預測半徑 r 和密度 σ。

外觀模型:如圖2c 所示,本文使用影像混合技術和球諧函數(SH)模型來建立混合外觀模型,其中影像混合技術表示離散視圖外觀c_ibr, SH 模型表示連續的依賴視圖的外觀c_sh。對於第t 訊框處的點x,其在視圖方向d 上的顏色為:

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

可微深度剝離

本文提出的動態場景表示借助深度剝離演算法可以渲染成影像。

研究者開發了一個自訂著色器來實現由 K 個渲染通道組成的深度剝離演算法。即對於一個特定的像素 u,研究者進行了多步驟處理,最後,經過 K 次渲染後,像素 u 得到一組排序點 {x_k|k = 1, ..., K}。

基於這些點{x_k|k = 1, ..., K},得到體渲染中像素u 的顏色表示為:

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

在訓練過程中,給定渲染的像素顏色C (u),本文將其與真實像素顏色C_gt (u) 進行比較,並使用以下損失函數以端到端的方式優化模型:

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

除此之外,本文也應用了知覺損失:

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

##以及掩碼損失:

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

最終的損失函數定義為:

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

實驗及結果

本文在DNA-Rendering、ENeRF-Outdoor、 NHR 以及Neural3DV 資料集評估了4K4D 方法。

在DNA-Rendering 資料集上的結果如表1 所示,結果顯示,4K4D 渲染速度比具有SOTA 效能的ENeRF 快30 倍,並且渲染品質更好。

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

在DNA-Rendering 資料集上的定性結果如圖5 所示,KPlanes 無法對4D 動態場景下的詳細外觀和幾何形狀進行恢復,而其他基於圖像的方法產生了高品質的外觀。然而,這些方法往往會在遮蔽和邊緣周圍產生模糊的結果,導致視覺品質下降,相反,4K4D 可以在超過 200 FPS 的情況下產生更高保真度的渲染。

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

接下來,實驗展示了不同方法在 ENeRFOutdoor 資料集上的定性和定量結果。如表 2 所示,4K4D 在以超過 140 FPS 的速度進行渲染時仍然取得了明顯更好的結果。

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

而其他方法,如ENeRF 產生了模糊的結果;IBRNet 的渲染結果包含影像邊緣周圍的黑色偽影,如圖3 所示;K-Planse 無法重建動態人體以及不同的背景區域。

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

表 6 展示了可微深度剝離演算法的有效性,4K4D 比基於 CUDA 的方法快 7 倍以上。

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

本文也在表 7 中報告了 4K4D 在不同解析度的不同硬體(RTX 3060、3090 和 4090)上的渲染速度。

4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍

更多細節請參考原論文。

以上是4K畫質3D合成影片不再卡成投影片,新方法將渲染速度提高了30倍的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1653
14
CakePHP 教程
1413
52
Laravel 教程
1305
25
PHP教程
1251
29
C# 教程
1224
24
排名前十的虛擬幣交易app有哪 最新數字貨幣交易所排行榜 排名前十的虛擬幣交易app有哪 最新數字貨幣交易所排行榜 Apr 28, 2025 pm 08:03 PM

Binance、OKX、gate.io等十大數字貨幣交易所完善系統、高效多元化交易和嚴密安全措施嚴重推崇。

全球幣圈十大交易所有哪些 排名前十的貨幣交易平台最新版 全球幣圈十大交易所有哪些 排名前十的貨幣交易平台最新版 Apr 28, 2025 pm 08:09 PM

全球十大加密貨幣交易平台包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、KuCoin和Poloniex,均提供多種交易方式和強大的安全措施。

靠譜的數字貨幣交易平台推薦 全球十大數字貨幣交易所排行榜2025 靠譜的數字貨幣交易平台推薦 全球十大數字貨幣交易所排行榜2025 Apr 28, 2025 pm 04:30 PM

靠谱的数字货币交易平台推荐:1. OKX,2. Binance,3. Coinbase,4. Kraken,5. Huobi,6. KuCoin,7. Bitfinex,8. Gemini,9. Bitstamp,10. Poloniex,这些平台均以其安全性、用户体验和多样化的功能著称,适合不同层次的用户进行数字货币交易

解密Gate.io戰略升級:MeMebox 2.0如何重新定義加密資產管理? 解密Gate.io戰略升級:MeMebox 2.0如何重新定義加密資產管理? Apr 28, 2025 pm 03:33 PM

MeMebox 2.0通過創新架構和性能突破重新定義了加密資產管理。 1) 它解決了資產孤島、收益衰減和安全與便利悖論三大痛點。 2) 通過智能資產樞紐、動態風險管理和收益增強引擎,提升了跨鏈轉賬速度、平均收益率和安全事件響應速度。 3) 為用戶提供資產可視化、策略自動化和治理一體化,實現了用戶價值重構。 4) 通過生態協同和合規化創新,增強了平台的整體效能。 5) 未來將推出智能合約保險池、預測市場集成和AI驅動資產配置,繼續引領行業發展。

全球幣圈十大交易所有哪些 排名前十的貨幣交易平台2025 全球幣圈十大交易所有哪些 排名前十的貨幣交易平台2025 Apr 28, 2025 pm 08:12 PM

2025年全球十大加密貨幣交易所包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、KuCoin、Bittrex和Poloniex,均以高交易量和安全性著稱。

比特幣值多少美金 比特幣值多少美金 Apr 28, 2025 pm 07:42 PM

比特幣的價格在20,000到30,000美元之間。 1. 比特幣自2009年以來價格波動劇烈,2017年達到近20,000美元,2021年達到近60,000美元。 2. 價格受市場需求、供應量、宏觀經濟環境等因素影響。 3. 通過交易所、移動應用和網站可獲取實時價格。 4. 比特幣價格波動性大,受市場情緒和外部因素驅動。 5. 與傳統金融市場有一定關係,受全球股市、美元強弱等影響。 6. 長期趨勢看漲,但需謹慎評估風險。

排名靠前的貨幣交易平台有哪些 最新虛擬幣交易所排名榜前10 排名靠前的貨幣交易平台有哪些 最新虛擬幣交易所排名榜前10 Apr 28, 2025 pm 08:06 PM

目前排名前十的虛擬幣交易所:1.幣安,2. OKX,3. Gate.io,4。幣庫,5。海妖,6。火幣全球站,7.拜比特,8.庫幣,9.比特幣,10。比特戳。

怎樣在C  中測量線程性能? 怎樣在C 中測量線程性能? Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

See all articles