有望取代Deepfake?揭秘今年最火熱的NeRF技術有多牛
什麼,你還不知道NeRF?
作為今年電腦視覺領域最火熱的AI技術,NeRF可謂是應用廣泛,前景一片大好。
B站上的朋友可算是把這項技術玩出了新花樣。
拋磚引玉
那麼,究竟NeRF是什麼?
NeRF(Neural Radiance Fields)是最早在2020年ECCV會議上的最佳論文中提出的概念,其將隱式表達推上了一個新的高度,僅用2D的posed images作為監督,即可表示複雜的三維場景。
一石激起千層浪,自此之後NeRF迅速發展被應用到多個技術方向,如「新視點合成、三維重建」等。
NeRF其輸入稀疏的多角度帶pose的圖像訓練得到一個神經輻射場模型,根據這個模型可以渲染出任意視角下的清晰的照片,如下圖所示。也可以簡單概括為用一個MLP去隱式地學習一個三維場景。
網友自然也會將NeRF與同樣大受追捧的Deepfake做個比較。
最近MetaPhysics發佈的一篇文章就盤點了NeRF的進化史、面臨的挑戰和優勢,並預測NeRF最終將取代Deepfake。
大部分關於deepfake技術引人注目的話題,是指自17年deepfakes進入大眾視野後開始流行的兩個開源軟體包:DeepFaceLab (DFL) 和FaceSwap。
儘管這兩個軟體包都擁有廣泛的用戶群和活躍的開發者社區,但這兩個專案與GitHub程式碼都沒有明顯的偏離。
當然,DFL和FaceSwap的開發人員並沒有閒著:現在可以使用更大的輸入影像來訓練deepfake模型,儘管這需要更昂貴的GPU。
但其實在過去的三年裡,媒體鼓吹的deepfake影像品質提升主要還是得歸功於終端用戶。
他們在資料收集方面累積了「省時而難得」的經驗,以及訓練模型的最佳方法(有時單次實驗就需要幾週時間),並且學會如何利用和擴展原始2017程式碼的最外層限制。
VFX和ML研究社群中的一些人正試圖透過擴展架構來突破流行的deepfake套件的「硬限制」,以便機器學習模型可以在高達1024×1024的影像上進行訓練。
其像素是DeepFaceLab或FaceSwap目前實際範圍的兩倍,更接近電影和電視製作中有用的解析度。
接下來讓我們一起了解一下NeRF吧~
揭開面紗
NeRF(Neural Radiance Fields),它出現於2020年,是一種透過在神經網路內拼接多個視點照片實現重建物件和環境的方法。
它透過使用稀疏的輸入視圖集來優化底層連續的體積場景函數,實現了綜合複雜場景視圖的最佳結果。
此演算法也使用全連接深度網路表示一個場景,其輸入是單一連續的5D座標(空間位置(x, y, z)和觀看方向(θ, φ)),其輸出是該空間位置的體積密度和相關的發射幅亮度。
透過沿著相機光線查詢5D座標來合成視圖,並使用經典的體繪製技術(volume rendering)將輸出的色彩和密度投影到影像中。
實現過程:
首先將一個連續的場景表示為一個5D向量值函數,其輸入是一個3D位置和2D觀看方向,對應的輸出是一個發射顏色c和體積密度σ。
在實務上,以3D笛卡爾單位向量d表示方向。利用用MLP網路近似這個連續的5D場景表示,並優化其權重。
此外,透過限制網路來預測體積密度σ作為位置x的函數,同時也允許RGB顏色c作為位置和觀看方向的函數進行預測,從而鼓勵表示多視圖一致。
為了實現這一點,MLP首先處理輸入的具有8個全連接層的3D座標x(使用ReLU激活和每層256個通道),並輸出σ和256維特徵向量。
這個特徵向量接著與相機射線的觀看方向連接,並傳遞給一個額外的全連接層,輸出與視圖相關的RGB顏色。
此外,NeRF還引入了兩個改進來實現高解析度複雜場景的表示。第一個是位置編碼,以幫助MLP表示高頻函數,第二個是分層抽樣過程,使其能夠有效地對高頻表示進行抽樣。
眾所周知,Transformer架構中的位置編碼可以提供序列中標記的離散位置,作為整個架構的輸入。而NeRF使用位置編碼是將連續的輸入座標映射到更高的維度空間,使MLP更容易逼近更高頻率的函數。
從圖中可以觀察到,移除位置編碼會大幅降低模型表示高頻幾何和紋理的能力,最終導致外觀過度平滑。
由於沿著每條相機射線在N個查詢點密集評估神經輻射場網路的渲染策略十分低效,所以NeRF最後採用了一種分層表示,透過按最終渲染的預期效果比例分配樣本來提高渲染效率。
簡而言之,NeRF不再只使用一個網絡來表示場景,而是同時優化兩個網絡,一個「粗粒度」網絡和一個「細粒度」網絡。
未來可期
NeRF解決了過去的不足,即使用MLP將物件和場景表示為連續函數。相較於過往的方法,NeRF可以產生更好的渲染效果。
但是,NeRF同樣也面臨許多科技瓶頸,例如NeRF的加速器會犧牲其他相對有用的功能(例如彈性),以實現低延遲、更多互動環境以及較少訓練時間的目的。
所以,NeRF雖然是一個關鍵性的突破,但想要達到完美的效果,還是需要一定的時間。
科技在進步,未來依舊可期!
以上是有望取代Deepfake?揭秘今年最火熱的NeRF技術有多牛的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

大家好,我卡頌。許多程式設計師朋友都希望參與自己的AI產品開發。我們可以根據"流程自動化程度"和"AI應用程度"將產品的形態分成四個像限。其中:流程自動化程度衡量「產品的服務流程有多少需要人工介入」AI應用程度衡量「AI在產品中應用的比重」首先,限制AI的能力,以處理一張AI圖片應用,用戶在應用內通過與UI互動就能完成完整的服務流程,進而自動化程度高。同時,「AI圖片處理」重度依賴AI的能力,所以AI應用程度高。第二象限,是常規的應用開發領域,例如開發知識管理應用、時間管理應用、流程自動化程度高

若是將人工智慧比喻為第四次工業革命的話,那麼大模型就是第四次工業革命的糧食儲備。在應用層面,它使工業界得以重溫1956年美國達特茅斯會議的設想,並正式開啟了重塑世界的序幕。根據大廠定義,AI家電是具備互聯互通、人機互動和主動決策能力的家電,AI家電可視為智慧家電的最高形態。然而,目前市面上AI加持的全屋智慧模式是否能成為未來產業的主角?家電產業是否會誕生新競爭格局?本文將從三個面向來解析。全屋智能為何雷聲大,雨點小?資料來源:Statista、中安網、艾瑞諮詢、洛圖科技、全國制鎖產業資訊中心

在2023年,生成式人工智慧(ArtificialIntelligenceGeneratedContent,簡稱AIGC)成為科技領域最熱門的話題,毫無疑問那麼對於製造業來說,他們應該如何從生成式AI這項新興技術中獲益?廣大正在實施數位轉型的中小企業,又可以由此獲得怎樣的啟示?最近,亞馬遜雲端科技與製造業的代表一同合作,就中國製造業目前的發展趨勢、傳統製造業數位轉型所面臨的挑戰與機遇,以及生成式人工智慧對製造業的創新重塑等話題進行了分享與深入探討生成式AI在製造業的應用現況提及中國製造業

IMAX中國AI藝術大片把戲院搬到經典地標漓江時光網訊近日,IMAX打造中國首款AI藝術大片,在AI技術的助力下,IMAX影院「落地」包括長城、敦煌、桂林漓江、張掖丹霞在內的多個國內經典地標。此款AI藝術大片由IMAX聯合數位藝術家@kefan404和尼歐數位創作,組畫共四張,IMAX標誌性的超大銀幕或鋪展於張掖丹霞繽紛絢麗的大自然「畫布」之中,或於承載千年文化累積的敦煌比鄰矗立,或與桂林漓江的山水長卷融為一體,或在層巒疊嶂之中眺望巍峨長城,令人不禁期待想像成真的那一天。自2008年於日本東京巨

華為常務董事餘承東在今天的微博上發布了HDC大會邀請函,暗示鴻蒙或許將具備AI大模型能力。根據他後續微博內容顯示,邀請函文字是由智慧語音助理小藝產生的。餘承東表示,鴻蒙世界即將帶來更智慧、更貼心的全新體驗根據先前曝光的資訊來看,今年鴻蒙4在AI能力方面有望取得重大進展,進一步鞏固了AI作為鴻蒙系統的核心特性

今年以來,360集團創辦人周鴻禕在所有公開場合的演講都離不開一個話題,那就是人工智慧大模型。他曾自稱“GPT的佈道者”,對ChatGPT取得的突破讚不絕口,更是堅定看好由此產生的AI技術迭代。身為一個擅於表達的明星企業家,週鴻禕的演講往往妙語連珠,所以他的「佈道」也創造過很多熱門話題,確實為AI大模型添了一把火。但對週鴻禕而言,光做意見領袖還不夠,外界更關心他執掌的360公司如何應對這波AI新浪潮。事實上,在360內部,週鴻禕也早已掀起一場全員變革,4月份,他發出內部信,要求360每一位員工、每

從人工呼叫中心時代,經歷了IVR流程設計、線上客服系統等的應用,到已經發展到如今的人工智慧(AI)客服。作為服務客戶的重要窗口,客服產業始終站在時代前端,不斷利用新科技發展新生產力,朝向高效率化、高品質化、高服務化以及個人化、全天候客戶服務邁進。伴隨著客戶群、數量的增多,以及人工服務成本的快速增加,如何利用人工智慧、大數據等新一代資訊科技,促進各行業的客戶服務中心從勞力密集到智慧化、精細化、精細化的技術轉型升級,已成為擺在許多產業面前的重要議題。得益於人工智慧技術不斷進步與場景化應用的快速

在一個充滿未來科技的世界中,人工智慧已經成為人類生活中不可或缺的助手。然而,人工智慧不僅是為了方便我們的生活,它還以一種悄然存在的方式改變人類社會的結構和運作。其中最重要的正面意義之一就是資訊平等化消除數位鴻溝,讓每個人都能平等享受科技帶來的便利性在當前數位化時代,資訊化已經成為推動社會發展的重要力量。然而,我們也面臨一個現實問題,就是存在著數位鴻溝,導致一部分人無法享受科技所帶來的便利。因此,資訊化平權顯得特別重要,它能夠消除數位鴻溝,讓每個人都能平等分享科技發展的成果,實現社會的全面進步
