目錄
一致性、品質和速度最優
首頁 科技週邊 人工智慧 北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

Jan 10, 2024 pm 11:09 PM
影像 2d

只要兩分鐘,玩圖片轉3D!

還是高紋理品質、多視角高一致性的那種。

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

不管是什麼物種,輸入時的單一視圖影像還是這樣嬸兒的:

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

兩分鐘後,3D版大功告成:

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

△上,Repaint123(NeRF);下,Repaint123(GS

新方法名為Repaint123,核心思想是將2D擴散模型的強大圖像生成能力與再繪策略的紋理對齊能力相結合,來產生高品質、多視角一致的圖像。

此外,研究還引入了針對重疊區域的可見性感知自適應再繪強度的方法。

Repaint123一舉解決了先前方法多視角偏差大、紋理退化、生成慢等問題。

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

目前專案程式碼還未在GitHub公佈,就有100 人趕來標星碼住:

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

## Repaint123長啥樣?

之前,將影像轉換為3D的方法通常會採用Score Distillation Sampling (SDS)。儘管該方法的結果令人印象深刻,但存在一些問題,例如多視角不一致、過度飽和、過度平滑的紋理以及生成速度緩慢。

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換
△從上到下:輸入,Zero123-XL,Magic123,Dream gaussian

為了解決這些問題,來自北京大學、鵬城實驗室、新加坡國立大學、武漢大學的研究人員提出了Repaint123。

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

總的來說,Repaint123有這幾點貢獻:

(1)Repaint123透過綜合考慮圖像到3D產生的可控重繪過程,能夠產生高品質的圖片序列,並確保這些圖片在多個視角下保持一致。

(2)Repaint123提出了一個簡單的單一視圖3D產生的基準方法。

在粗模階段,它利用Zero123作為3D先驗,並結合SDS損失函數,透過優化Gaussian Splatting幾何,快速產生粗糙的3D模型(僅需1分鐘)。

在細模階段,它採用Stable Diffusion作為2D先驗,並結合均方誤差(MSE)損失函數,透過快速細化網格紋理,產生高品質的3D模型(同樣只需1分鐘)。

(3)大量的實驗證明了Repaint123方法的有效性。它能夠在短短2分鐘內,從單張影像中產生與2D生成品質相符的高品質3D內容。

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換
△實現3D一致且高品質的單視角3D快速生成

下面來看具體方法。

Repaint123專注於優化mesh細化階段,其主要改進方向涵蓋兩個方面:產生具有多視角一致性的高品質影像序列以及實現快速且高品質的3D重建。

1、產生具有多視角一致性的高品質影像序列

產生具有多視角一致性的高品質影像序列分為以下三個部分:

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換
△多視角一致的影像生成流程

#DDIM反演

為了保留在粗模階段生成的3D一致的低頻紋理訊息,作者採用了DDIM反演將影像反演到確定的潛在空間,為後續的去噪過程奠定基礎,產生忠實一致的影像。

可控去雜訊

為了在去噪階段控制幾何一致性和長程紋理一致性,作者引入了ControlNet,使用粗模渲染的深度圖作為幾何先驗,同時注入參考圖的Attention特徵進行紋理遷移。

此外,為了執行無分類器引導以提升圖像質量,論文使用CLIP將參考圖編碼為圖像提示,用於指導去噪網路。

重繪

漸進式重繪遮蔽和重疊部分為了確保影像序列中相鄰影像的重疊區域在像素層級對齊,作者採用了漸進式局部重繪的策略。

在保持重疊區域不變的同時,產生和諧一致的相鄰區域,並從參考視角逐步延伸到360°。

然而,如下圖所示,作者發現重疊區域同樣需要進行細化,因為在正視時之前斜視的區域的可視分辨率變大,需要補充更多的高頻資訊。

另外,細化強度等於1-cosθ*,其中θ*為先前所有相機視角與所視表面法向量夾角θ的最大值,從而自適應地重繪重疊區域。

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

△相機視角與細化強度的關係

為了選擇適當的細化強度,以在提高品質的同時保證忠實度,作者藉鑑了投影定理和影像超分的思想,提出了一種簡單而直接的可見性感知的重繪策略來細化重疊區域。

2、快速且高品質的3D重建

如下圖所展示的,作者在進行快速且高品質的3D重建過程中,採用了兩階段方法。

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

△Repaint123兩階段單視角3D生成框架

首先,他們利用Gaussian Splatting表示來快速產生合理的幾何結構和粗糙的紋理。

同時,借助先前產生的多視角一致的高品質影像序列,作者能夠使用簡單的均方誤差(MSE)損失進行快速的3D紋理重建。

一致性、品質和速度最優

研究人員對多個單一視圖產生任務的方法進行了比較。

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

△單視圖3D產生視覺化比較

在RealFusion15和Test-alpha資料集上,Repaint123取得了在一致性、品質和速度三個方面最領先的效果。

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

同時,作者也對論文使用的每個模組的有效性以及視角轉動增量進行了消融實驗:

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換
北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

並且發現,視角間隔為60度時,效能達到峰值,但視角間隔過大會減少重疊區域,增加多面問題的可能性,所以40度可作為最佳視角間隔。

北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換

論文網址:https://arxiv.org/pdf/2312.13271.pdf
程式碼位址:https:// pku-yuangroup.github.io/repaint123/
專案網址:https://pku-yuangroup.github.io/repaint123/

#

以上是北大出品:紋理品質與多視角一致性的最新SOTA,在2分鐘內實現1張圖的3D轉換的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

如何在 Windows 11 中清除桌面背景最近的影像歷史記錄 如何在 Windows 11 中清除桌面背景最近的影像歷史記錄 Apr 14, 2023 pm 01:37 PM

<p>Windows 11 改進了系統中的個人化功能,這使用戶可以查看先前所做的桌面背景變更的近期歷史記錄。當您進入windows系統設定應用程式中的個人化部分時,您可以看到各種選項,而更改背景桌布也是其中之一。但是現在可以看到您系統上設置的背景壁紙的最新歷史。如果您不喜歡看到此內容並想清除或刪除此最近的歷史記錄,請繼續閱讀這篇文章,它將幫助您詳細了解如何使用註冊表編輯器進行操作。 </p><h2>如何使用登錄編輯

如何在電腦上下載 Windows 聚光燈桌布影像 如何在電腦上下載 Windows 聚光燈桌布影像 Aug 23, 2023 pm 02:06 PM

窗戶從來不是一個忽視美學的人。從XP的田園綠場到Windows11的藍色漩渦設計,預設桌面桌布多年來一直是用戶愉悅的來源。借助WindowsSpotlight,您現在每天都可以直接存取鎖定螢幕和桌面桌布的美麗、令人敬畏的圖像。不幸的是,這些圖像並沒有閒逛。如果您愛上了Windows聚光燈圖像之一,那麼您將想知道如何下載它們,以便將它們作為背景保留一段時間。以下是您需要了解的所有資訊。什麼是WindowsSpotlight?窗口聚光燈是一個自動壁紙更新程序,可以從“設定”應用中的“個性化&gt

如何在Python中使用影像語意分割技術? 如何在Python中使用影像語意分割技術? Jun 06, 2023 am 08:03 AM

隨著人工智慧技術的不斷發展,影像語意分割技術已成為影像分析領域的熱門研究方向。在影像語意分割中,我們將一張影像中的不同區域進行分割,並對每個區域進行分類,從而達到對這張影像的全面理解。 Python是一種著名的程式語言,其強大的資料分析和資料視覺化能力使其成為了人工智慧技術研究領域的首選。本文將介紹如何在Python中使用影像語意分割技術。一、前置知識在深入

如何在Windows上使用PowerToys批次調整影像大小 如何在Windows上使用PowerToys批次調整影像大小 Aug 23, 2023 pm 07:49 PM

那些必須每天處理圖像檔案的人經常不得不調整它們的大小以適應他們的專案和工作的需求。但是,如果要處理的圖像太多,則單獨調整它們的大小會消耗大量時間和精力。在這種情況下,像PowerToys這樣的工具可以派上用場,除此之外,可以使用其影像調整大小器實用程式批次調整影像檔案的大小。以下是設定影像調整器設定並開始使用PowerToys批次調整影像大小的方法。如何使用PowerToys批次調整影像大小PowerToys是一個多合一的程序,具有各種實用程式和功能,可協助您加快日常任務。它的實用程式之一是圖像

iOS 17:如何在照片中使用一鍵裁剪 iOS 17:如何在照片中使用一鍵裁剪 Sep 20, 2023 pm 08:45 PM

透過iOS17照片應用,Apple可以更輕鬆地根據您的規格裁剪照片。繼續閱讀以了解如何操作。以前在iOS16中,在「照片」應用程式中裁剪圖像涉及幾個步驟:點擊編輯介面,選擇裁剪工具,然後透過捏合縮放手勢或拖曳裁剪工具的角落來調整裁剪。在iOS17中,值得慶幸的是,蘋果簡化了這個過程,這樣當你放大照片庫中任何選定的照片時,一個新的「裁剪」按鈕會自動出現在螢幕的右上角。點擊它會彈出完整的裁剪介面,其中包含您選擇的縮放級別,因此您可以裁剪到您喜歡的圖像部分,旋轉圖像,反轉圖像,或應用螢幕比例,或使用標記

2D影像腦補3D人體,衣服隨便搭,還能改動作 2D影像腦補3D人體,衣服隨便搭,還能改動作 Apr 11, 2023 pm 02:31 PM

由於 NeRF 提供的可微渲染,近期的三維生成模型已經在靜止物體上達到了令人驚豔的效果。但是在人體這種更複雜且可形變的類別上,三維生成依舊有很大的挑戰。本文提出了一個高效的組合的人體 NeRF 表達,實現了高分辨率(512x256)的三維人體生成,並且沒有使用超分模型。 EVA3D 在四個大型人體資料集上都大幅超越了現有方案,程式碼已開源。論文名稱:EVA3D: Compositional 3D Human Generation from 2D image Collections論文地址:http

新視角圖像生成:討論基於NeRF的泛化方法 新視角圖像生成:討論基於NeRF的泛化方法 Apr 09, 2023 pm 05:31 PM

新視角影像生成(NVS)是電腦視覺的一個應用領域,在1998年SuperBowl的比賽,CMU的RI曾展示過給定多攝像頭立體視覺(MVS)的NVS,當時這個技術曾轉讓給美國一家體育電視台,但最終沒有商業化;英國BBC廣播公司為此做過研發投入,但是沒有真正產品化。在基於影像渲染(IBR)領域,NVS應用有一個分支,即基於深度影像的渲染(DBIR)。另外,在2010年曾經很火熱的3D TV,也是需要從單眼影片中得到雙眼立體,但是由於技術的不成熟,最終沒有流行起來。當時基於機器學習的方法已經開始研究,比

如何使用 iOS 17 在 iPhone 上編輯照片 如何使用 iOS 17 在 iPhone 上編輯照片 Nov 30, 2023 pm 11:39 PM

行動攝影從根本上改變了我們捕捉和分享生活瞬間的方法。智慧型手機的出現,尤其是iPhone,在這一轉變中發揮了關鍵作用。 iPhone以其先進的相機技術和用戶友好的編輯功能而聞名,已成為業餘和經驗豐富的攝影師的首選。 iOS17的推出標誌著這趟旅程中的一個重要里程碑。 Apple的最新更新帶來了一套增強的照片編輯功能,為用戶提供了一個更強大的工具包,將他們的日常快照變成視覺上引人入勝且藝術豐富的圖像。這種技術的發展不僅簡化了攝影過程,還為創意表達開闢了新的途徑,使用戶能夠毫不費力地為他們的照片注入專業氣息

See all articles