開源！超越ZoeDepth！ DepthFM：快速且精確的單目深度估計！-人工智慧-PHP中文網

作者：Ming Gui, Johannes S. Fischer, Ulrich Prestel, Pingchuan Ma, Dmytro Kotovenko, Olga Grebenkova, Stefan Andreas Baumann, Vincent Tao Hu, Björn Ommer

. #原文連結：https://arxiv.org/abs/2403.13788

程式碼連結：https://github.com/CompVis/depth-fm

官方首頁：https:// depthfm.github.io/

2. 摘要

#針對許多下游觀光任務和應用至關重要。目前針對此問題的判別式方法受到模糊偽影的限制，而最先進的生成方法由於其SDE性質導致訓練樣本速度緩慢。我們不是從雜訊開始，而是尋求從輸入影像到深度影像的直接映射。我們觀察到這可透過流匹配來有效地構建，因為其在解空間中的直線軌跡提供了效率和高品質。我們的研究表明，預先訓練的影像擴散模型可用於作為流匹配深度模型的充分先驗知識。在複雜自然場景的基準測試中，儘管僅在少量合成資料上進行訓練，我們的輕量級方法以有利的低計算成本表現出最先進的性能。

3. 效果展示

DepthFM是一種具有強零樣本泛化能力的快速推理流匹配模型，可利用強大的先驗知識，並且很容易地泛化到未知的真實影像中。在合成資料上進行訓練後，模型可以很好地泛化到未知的真實影像中，並對深度影像進行精確匹配。

與其他最先進的模型相比，DepthFM僅用一個函數評估就獲得了明顯更清晰的圖像。 Marigold的深度估計耗時是DepthFM的兩倍，但無法產生相同粒度的深度圖。开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！ 4. 主要貢獻

#（1）提出了DepthFM，一種最先進的、多功能的、快速的單目深度估計模型。除了傳統的深度估計任務外，DepthFM還展示了在深度修補和深度條件影像合成等下游任務中的最新能力。

（2）展示了將強大的圖像先驗從擴散模型成功轉移到流匹配模型，幾乎不依賴訓練數據，也不需要真實世界的圖像。

（3）表明，流匹配模型高效，並能在單一推理步驟內合成深度圖。

（4）儘管僅在合成資料上進行訓練，但DepthFM在基準資料集和自然影像上表現出色。

（5）將表面法線損失作為輔助目標，以獲得更準確的深度估計。

（6）除了深度估計，還可可靠地預測其預測的置信度。

5. 具體原理是啥？

訓練Pipeline。

訓練受到流匹配和表面法向損失的限制：對於流匹配，使用資料依賴的流匹配來回歸地面真實深度與對應影像之間的向量場。此外，透過一個表面法向損失來實現幾何真實感。

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！資料相關的流匹配：

DepthFM透過利用影像到深度對，回歸出影像分佈和深度分佈之間的直線向量場。這種方法在不犧牲性能的情況下促進了高效的幾步推理。

從擴散先驗微調：

作者展示了成功將強大的圖像先驗從基礎圖像合成擴散模型（Stable Diffusion v2-1）轉移到流匹配模型，幾乎不依賴訓練數據，並且不需要真實世界的圖像。

輔助表面法線損失：

考慮到DepthFM只在合成資料上進行訓練，大多數合成資料集提供了地面真實表面法線，並將表面法線損失作為輔助目標，以增強DepthFM深度估計的準確性。

6. Результаты экспериментов

DepthFM демонстрирует значительную способность к обобщению, обучаясь только на 63 тысячах чисто синтетических образцов, и может выполнять обучение нулевого уровня на наборах данных внутри и снаружи. Оценка глубины выстрела. В таблице 1 качественно показано сравнение производительности DepthFM с соответствующими современными моделями. В то время как другие модели часто полагаются на большие наборы данных для обучения, DepthFM использует богатые знания, присущие базовой модели, основанной на диффузии. Этот метод не только экономит вычислительные ресурсы, но и подчеркивает адаптивность и эффективность обучения модели.

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

Сравнение оценки глубины Marigold на основе диффузии, эталонного теста Flow Matching (FM) и модели DepthFM. Каждый метод оценивается с использованием только одного члена ансамбля и с различным количеством оценок функций (NFE) на двух общих эталонных наборах данных. По сравнению с базовой линией FM, DepthFM объединяет нормальные потери и связь, зависящую от данных во время обучения.

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

Качественные результаты для моделей Marigold и DepthFM при различном количестве функциональных оценок. Стоит отметить, что Marigold не дает никаких значимых результатов посредством одношагового вывода, в то время как результаты DepthFM уже показывают реальную карту глубины.

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

Выполните глубокое завершение в Hypersim. Слева: придание глубины. Средняя: Глубина оценивается на основе заданной частичной глубины. Справа: Истинная глубина.

开源！超越ZoeDepth！ DepthFM：快速且精确的单目深度估计！

#7.Резюме

DepthFM, метод сопоставления потоков для монокулярной оценки глубины. Путем изучения прямого сопоставления между входным изображением и глубиной, а не шумоподавления нормального распределения в карте глубины, этот подход значительно более эффективен, чем текущие решения на основе диффузии, но при этом обеспечивает мелкозернистые карты глубины без общих артефактов дискриминационной парадигмы. . DepthFM использует предварительно обученную модель диффузии изображения в качестве априорной, эффективно передавая ее в модель сопоставления глубокого потока. Таким образом, DepthFM обучается только на синтетических данных, но при этом хорошо обобщает естественные изображения во время вывода. Кроме того, было показано, что нормальные потери на вспомогательной поверхности улучшают оценку глубины. Облегченный подход DepthFM является конкурентоспособным, быстрым и обеспечивает надежные достоверные оценки.

Читатели, которых интересуют дополнительные экспериментальные результаты и подробности статьи, могут прочитать оригинальную статью

以上是開源！超越ZoeDepth！ DepthFM：快速且精確的單目深度估計！的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

AI Hentai Generator

免費產生 AI 無盡。

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7483

CakePHP 教程

1377

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

使用ddrescue在Linux上恢復數據 Mar 20, 2024 pm 01:37 PM

DDREASE是一種用於從檔案或區塊裝置(如硬碟、SSD、RAM磁碟、CD、DVD和USB儲存裝置)復原資料的工具。它將資料從一個區塊設備複製到另一個區塊設備，留下損壞的資料區塊，只移動好的資料區塊。 ddreasue是一種強大的恢復工具，完全自動化，因為它在恢復操作期間不需要任何干擾。此外，由於有了ddasue地圖文件，它可以隨時停止和恢復。 DDREASE的其他主要功能如下：它不會覆寫恢復的數據，但會在迭代恢復的情況下填補空白。但是，如果指示工具明確執行此操作，則可以將其截斷。將資料從多個檔案或區塊還原到單

開源！超越ZoeDepth！ DepthFM：快速且精確的單目深度估計！ Apr 03, 2024 pm 12:04 PM

0.這篇文章乾了啥？提出了DepthFM：一個多功能且快速的最先進的生成式單目深度估計模型。除了傳統的深度估計任務外，DepthFM還展示了在深度修復等下游任務中的最先進能力。 DepthFM效率高，可以在少數推理步驟內合成深度圖。以下一起來閱讀這項工作~1.論文資訊標題：DepthFM:FastMonocularDepthEstimationwithFlowMatching作者：MingGui,JohannesS.Fischer,UlrichPrestel,PingchuanMa,Dmytr

你好，電動Atlas！波士頓動力機器人復活，180度詭異動作嚇到馬斯克 Apr 18, 2024 pm 07:58 PM

波士頓動力Atlas，正式進入電動機器人時代！昨天，液壓Atlas剛「含淚」退出歷史舞台，今天波士頓動力就宣布：電動Atlas上崗。看來，在商用人形機器人領域，波士頓動力是下定決心要跟特斯拉硬剛一把了。新影片放出後，短短十幾小時內，就已經有一百多萬觀看。舊人離去，新角色登場，這是歷史的必然。毫無疑問，今年是人形機器人的爆發年。網友銳評：機器人的進步，讓今年看起來像人類的開幕式動作、自由度遠超人類，但這真不是恐怖片？影片一開始，Atlas平靜地躺在地上，看起來應該是仰面朝天。接下來，讓人驚掉下巴

Google狂喜：JAX性能超越Pytorch、TensorFlow！或成GPU推理訓練最快選擇 Apr 01, 2024 pm 07:46 PM

谷歌力推的JAX在最近的基準測試中表現已經超過Pytorch和TensorFlow，7項指標排名第一。而且測試並不是JAX性能表現最好的TPU上完成的。雖然現在在開發者中，Pytorch依然比Tensorflow更受歡迎。但未來，也許有更多的大型模型會基於JAX平台進行訓練和運行。模型最近，Keras團隊為三個後端（TensorFlow、JAX、PyTorch）與原生PyTorch實作以及搭配TensorFlow的Keras2進行了基準測試。首先，他們為生成式和非生成式人工智慧任務選擇了一組主流

iPhone上的蜂窩數據網路速度慢：修復 May 03, 2024 pm 09:01 PM

在iPhone上面臨滯後，緩慢的行動數據連線？通常，手機上蜂窩互聯網的強度取決於幾個因素，例如區域、蜂窩網絡類型、漫遊類型等。您可以採取一些措施來獲得更快、更可靠的蜂窩網路連線。修復1–強制重啟iPhone有時，強制重啟設備只會重置許多內容，包括蜂窩網路連線。步驟1–只需按一次音量調高鍵並放開即可。接下來，按降低音量鍵並再次釋放它。步驟2–過程的下一部分是按住右側的按鈕。讓iPhone完成重啟。啟用蜂窩數據並檢查網路速度。再次檢查修復2–更改資料模式雖然5G提供了更好的網路速度，但在訊號較弱

快手版Sora「可靈」開放測試：生成超120s視頻，更懂物理，複雜運動也能精準建模 Jun 11, 2024 am 09:51 AM

什麼？瘋狂動物城被國產AI搬進現實了？與影片一同曝光的，是一款名為「可靈」全新國產影片生成大模型。 Sora利用了相似的技術路線，結合多項自研技術創新，生產的影片不僅運動幅度大且合理，還能模擬物理世界特性，具備強大的概念組合能力與想像。數據上看，可靈支持生成長達2分鐘的30fps的超長視頻，分辨率高達1080p，且支援多種寬高比。另外再劃個重點，可靈不是實驗室放出的Demo或影片結果演示，而是短影片領域頭部玩家快手推出的產品級應用。而且主打一個務實，不開空頭支票、發布即上線，可靈大模型已在快影

超級智能體生命力覺醒！可自我更新的AI來了，媽媽再也不用擔心資料瓶頸難題 Apr 29, 2024 pm 06:55 PM

哭死啊，全球狂煉大模型，一網路的資料不夠用，根本不夠用。訓練模型搞得跟《飢餓遊戲》似的，全球AI研究者，都在苦惱怎麼才能餵飽這群資料大胃王。尤其在多模態任務中，這問題尤其突出。一籌莫展之際，來自人大系的初創團隊，用自家的新模型，率先在國內把「模型生成數據自己餵自己」變成了現實。而且還是理解側和生成側雙管齊下，兩側都能產生高品質、多模態的新數據，對模型本身進行數據反哺。模型是啥？中關村論壇上剛露面的多模態大模型Awaker1.0。團隊是誰？智子引擎。由人大高瓴人工智慧學院博士生高一鑷創立，高

美國空軍高調展示首個AI戰鬥機！部長親自試駕全程未乾預，10萬行代碼試飛21次 May 07, 2024 pm 05:00 PM

最近，軍事圈被這個消息刷屏了：美軍的戰鬥機，已經能由AI完成全自動空戰了。是的，就在最近，美軍的AI戰鬥機首次公開，揭開了神秘面紗。這架戰鬥機的全名是可變穩定性飛行模擬器測試飛機（VISTA），由美空軍部長親自搭乘，模擬了一對一的空戰。 5月2日，美國空軍部長FrankKendall在Edwards空軍基地駕駛X-62AVISTA升空注意，在一小時的飛行中，所有飛行動作都由AI自主完成！ Kendall表示——在過去的幾十年中，我們一直在思考自主空對空作戰的無限潛力，但它始終顯得遙不可及。然而如今，

See all articles

開源！超越ZoeDepth！ DepthFM：快速且精確的單目深度估計！

0. 這篇文章做了啥？

##1. 論文資訊

DepthFM是一種具有強零樣本泛化能力的快速推理流匹配模型，可利用強大的先驗知識，並且很容易地泛化到未知的真實影像中。在合成資料上進行訓練後，模型可以很好地泛化到未知的真實影像中，並對深度影像進行精確匹配。

#（1）提出了DepthFM，一種最先進的、多功能的、快速的單目深度估計模型。除了傳統的深度估計任務外，DepthFM還展示了在深度修補和深度條件影像合成等下游任務中的最新能力。

訓練Pipeline。

6. Результаты экспериментов

#7.Резюме

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題