NeRF新研究來了:3D場景無痕移除不需要對象,精確到毛髮
神經輻射場(NeRF)已經成為一種流行的新視圖合成方法。雖然 NeRF 正在快速泛化到更廣泛的應用以及資料集中,但直接編輯 NeRF 的建模場景仍然是一個巨大的挑戰。一個重要的任務是從 3D 場景中刪除不需要的對象,並與其周圍場景保持一致性,這個任務稱為 3D 影像修復。在 3D 中,解決方案必須在多個視圖中保持一致,並且在幾何上具有有效性。
本文來自三星、多倫多大學等機構的研究人員提出了一種新的三維修復方法來解決這些挑戰,在單一輸入影像中給定一小組姿態影像和稀疏註釋,提出的模型框架首先快速獲得目標對象的三維分割掩碼並使用該掩碼,然後引入一種基於感知優化的方法,該方法利用學習到的二維圖像再進行修復,將他們的信息提取到三維空間,同時確保視圖的一致性。
研究也透過訓練一個很有挑戰性的現實場景的資料集,為評估三維場景內修復方法帶來了新的基準測試。特別是,該資料集包含了有或沒有目標物件的相同場景的視圖,從而使三維空間內修復任務能夠進行更有原則的基準測試。
- #論文網址:https://arxiv.org/pdf/2211.12254.pdf
- 論文首頁:https://spinnerf3d.github.io/
下面為效果展示,移除一些物件後,還能與周圍場景保持一致性:
#本文方法和其他方法的比較,其他方法存在明顯的偽影,而本文的方法不是很明顯:
#方法介紹
作者透過一個整合的方法來應對三維場景編輯任務中的各種挑戰,該方法獲取場景的多視圖圖像,以用戶輸入提取到的3D 掩碼,並用NeRF 訓練來擬合到掩碼圖像中,這樣目標對象就被合理的三維外觀和幾何形狀取代。現有的互動式二維分割方法沒有考慮三維方面的問題,而且目前基於 NeRF 的方法不能使用稀疏註釋得到好的結果,也沒有達到足夠的精度。雖然目前一些基於 NeRF 的演算法允許去除物體,但它們並不試圖提供新生成的空間部分。根據目前的研究進展,這項工作是第一個在單一框架中同時處理互動式多視圖分割和完整的三維圖像修復的方法。
研究者利用現成的、無 3D 的模型進行分割和影像修復,並以視圖一致性的方式將其輸出轉移到 3D 空間。建立在 2D 互動式分割工作的基礎上,作者所提出的模型從一個目標物件上的少量使用者用滑鼠標定的圖像點開始。由此,他們的演算法用一個基於視訊的模型初始化掩碼,並透過擬合一個語義掩碼的 NeRF ,將其訓練成一個連貫的 3D 分割。然後,再應用預先訓練的二維影像修復到多視圖影像集上,NeRF 擬合過程用於重建三維影像場景,利用感知損失去約束2 維畫影像的不一致,以及畫深度影像規範化遮罩的幾何區域。總的來說,研究者提供了一個完整的方法,從物件選擇到嵌入的場景的新視圖合成,在一個統一的框架中對使用者的負擔最小,如下圖所示。
綜上所述,這篇工作的貢獻如下:
- 一個完整的3D 場景操作過程,從使用者互動的物件選擇開始,到3D 修復的NeRF 場景結束;
- 將二維的分割模型擴展到多視圖情況,能夠從稀疏註釋中恢復出具有三維一致的掩碼;
- #確保視圖一致性和感知合理性,一種新的基於優化的三維修復公式,利用二維影像修復;
- 一個新的用於三維編輯任務評估的資料集,包括對應的操作後的Groud Truth。
具體到方法上面,研究首先描述如何從單一視圖註解中初始化一個粗略的 3D 遮罩。將已標註的原始碼檢視表示為 I_1。將物件和來源視圖的稀疏資訊給一個互動式分割模型,用來估計初始來源物件遮罩#。然後將訓練視圖作為一個視訊序列,與
一起給予一個視訊實例分割模型V ,以計算
,其中
#是I_i 的物件掩碼的初始猜測。初始的遮罩通常在邊界附近是不準確的,因為訓練視圖實際上並不是相鄰的視訊幀,而視訊分割模型通常是未知 3D 的。
多視圖分割模組取得輸入的RGB 影像、對應的相機內在和外部參數,以及初始遮罩去訓練一個語意NeRF 。上圖描述了語意 NeRF 中使用的網路;對於點 x 和視圖目錄 d,除了密度 σ 和顏色 c 外,它還傳回一個 pre-sigmoid 型的物件 logit,s (x)。為了其快速收斂,研究者使用 instant-NGP 作為他們的 NeRF 架構。與光線r 相關聯的期望客觀性是透過在方程式中呈現r 上的點的對數而不是它們相對於密度的顏色而得到的:
然後使用分類損失進行監督:
用於監督基於NeRF 的多視圖分割模型的總體損失為:
#最後,採用兩個階段進行最佳化,進一步改進掩碼;在獲得初始三維掩碼後,從訓練視圖呈現掩碼,並用於監督二次多視圖分割模型作為初始假設(而不是視訊分割輸出)。
上圖顯示了視圖一致的修正方法概述。由於資料的缺乏妨礙了直接訓練三維修改修復模型,該研究利用現有的二維修復模型來獲得深度和外觀先驗,然後監督 NeRF 對完整場景的渲染擬合。這個嵌入的 NeRF 使用以下損失進行訓練:
#即使有感知損失,修復視圖之間的差異也會錯誤地引導模型收斂到低品質幾何(例如,攝影機附近可能形成“模糊” 幾何測量,以解釋每個視圖的不同資訊)。因此,研究員使用已產生的深度圖作為 NeRF 模型的額外指導,並在計算感知損失時分離權值,使用感知損失只擬合場景的顏色。為此,研究者使用了一個對包含不需要的物件的圖像進行了最佳化的 NeRF,並渲染了與訓練視圖對應的深度圖。其計算方法是用到相機的距離而不是點的顏色代替的方法:
然後將渲染的深度輸入到修復器模型,以獲得修復完的深度圖。研究發現,使用 LaMa 進行深度繪製,例如 RGB,可以獲得足夠高品質的結果。這個 NeRF 可以是與用於多視圖分割的相同模型,如果使用其他來源來獲取掩碼,如人工註釋的掩碼,一個新的 NeRF 將被安裝到場景中。然後,這些深度圖被用來監督已修復的 NeRF 的幾何形狀,透過其渲染深度然後將渲染的深度輸入到修復器模型,以獲得修復完的深度圖。研究發現,使用 LaMa 進行深度繪製,例如 RGB,可以獲得足夠高品質的結果。這個 NeRF 可以是與用於多視圖分割的相同模型,如果使用其他來源來獲取掩碼,如人工註釋的掩碼,一個新的 NeRF 將被安裝到場景中。然後,這些深度圖被用來監督已修復的NeRF 的幾何形狀,透過其渲染深度到修復的深度的到修復的深度的距離:
##多視圖分割:首先評估MVSeg 模型,沒有任何編輯修復。在本實驗中,假設稀疏影像點已經給出了一個現成的互動式分割模型,並且來源遮罩是可用的。因此,該任務是將來源遮罩傳輸到其他視圖中。下表顯示,新模型優於 2D(3D 不一致)和 3D 基準。此外研究者提出的兩階段最佳化有助於進一步改進所得到的遮罩。
下表顯示了 MV 方法與基準的比較,總的來說,新提出的方法明顯優於其他二維和三維修復方法。下表進一步顯示,移除幾何圖形結構的引導會降低已修復的場景品質。
定性結果如圖 6、圖 7 所示。圖 6 表明,本文方法可以重建具有詳細紋理的視圖一致場景,包括有光澤和無光澤表面的連貫視圖。圖 7 表明, 本文的感知方法減少了遮罩區域的精確重建約束,從而在使用所有影像時防止了模糊的出現,同時也避免了單一視圖監督造成的偽影。
以上是NeRF新研究來了:3D場景無痕移除不需要對象,精確到毛髮的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

全球十大加密貨幣交易平台包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、KuCoin和Poloniex,均提供多種交易方式和強大的安全措施。

MeMebox 2.0通過創新架構和性能突破重新定義了加密資產管理。 1) 它解決了資產孤島、收益衰減和安全與便利悖論三大痛點。 2) 通過智能資產樞紐、動態風險管理和收益增強引擎,提升了跨鏈轉賬速度、平均收益率和安全事件響應速度。 3) 為用戶提供資產可視化、策略自動化和治理一體化,實現了用戶價值重構。 4) 通過生態協同和合規化創新,增強了平台的整體效能。 5) 未來將推出智能合約保險池、預測市場集成和AI驅動資產配置,繼續引領行業發展。

Binance、OKX、gate.io等十大數字貨幣交易所完善系統、高效多元化交易和嚴密安全措施嚴重推崇。

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

靠谱的数字货币交易平台推荐:1. OKX,2. Binance,3. Coinbase,4. Kraken,5. Huobi,6. KuCoin,7. Bitfinex,8. Gemini,9. Bitstamp,10. Poloniex,这些平台均以其安全性、用户体验和多样化的功能著称,适合不同层次的用户进行数字货币交易

比特幣的價格在20,000到30,000美元之間。 1. 比特幣自2009年以來價格波動劇烈,2017年達到近20,000美元,2021年達到近60,000美元。 2. 價格受市場需求、供應量、宏觀經濟環境等因素影響。 3. 通過交易所、移動應用和網站可獲取實時價格。 4. 比特幣價格波動性大,受市場情緒和外部因素驅動。 5. 與傳統金融市場有一定關係,受全球股市、美元強弱等影響。 6. 長期趨勢看漲,但需謹慎評估風險。

2025年全球十大加密貨幣交易所包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、KuCoin、Bittrex和Poloniex,均以高交易量和安全性著稱。
