社群

學習

工具庫

AI工具

休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > 擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑

PHPz

發布： 2024-04-02 17:40:26

轉載

1398 人瀏覽過

「擴散模型」也能攻克演算法難題？

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑圖片

一位博士研究人員做了一個有趣的實驗，用「離散擴散」尋找用圖像表示的迷宮中的最短路徑。

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑圖片

作者介紹，每個迷宮都是透過重複添加水平和垂直牆生成的。

其中，起始點和目標點隨機選取。

從起點到目標點的最短路徑中，隨機取樣一條作為解的路徑。最短路徑是透過精確演算法算出來的。

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑圖片

然後使用離散擴散模型和U-Net。

將起點和目標的迷宮被編碼在一個通道中，而模型在另一個通道中用解來消除迷宮的雜訊。

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑圖片

再難一點的迷宮，也能做的很好。

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑圖片

為了估算去雜訊步驟p(x_{t-1} | x_t)，演算法會估算p( x_0 | x_t)。在這個過程中可視化這一估計值（底行），顯示“當前假設”，最終聚焦在結果上。

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑圖片

英偉達資深科學家Jim Fan表示，這是一個有趣的實驗，擴散模型可以「渲染」演算法。它可以只從像素實現迷宮遍歷，甚至使用了比Transforme弱得多的U-Net。

我一直認為擴散模型是渲染器，而Transformer是推理引擎。看起來，渲染器本身也可以編碼非常複雜的順序演算法。

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑圖片

這個實驗簡直驚呆了網友，「擴散模型還能做什麼？！」

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑圖片

也有人表示，一旦有人在足夠好的資料集上訓練擴散Transformer，AGI就解決了。

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑圖片

不過這項研究尚未正式發布，作者表示稍後更新在arxiv上。

值得一提的是，在這個實驗中，他們採用了Google腦團隊曾在2021年提出的離散擴散模型。

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑圖片

就在最近，這項研究重新更新了一版。

離散擴散模型

「生成模型」是機器學習中的核心問題。

它既可用於衡量我們擷取自然資料集統計資料的能力，也可用於需要產生影像、文字和語音等高維度資料的下游應用程式。

GAN、VAE、大型自回歸神經網路模型、歸一化流等方法，在樣本品質、取樣速度、對數似然，以及訓練穩定性方面都各有千秋。

最近，「擴散模型」已成為圖像、音訊生成，最受歡迎的替代方案。

它可以用更少的推理步驟，實現了與GAN相當的樣本質量，以及與自回歸模型相當的對數似然。

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑圖片

論文網址：https://www.php.cn/link/46994a3cd8d943d03b44b8fc9792d435

#雖然已有人提出了離散和連續狀態空間的擴散模型，但最近的研究主要集中在，連續狀態空間中運行的高斯擴散過程（如實值圖像和波形資料）。

離散狀態空間的擴散模型，已在文本和圖像分割領域進行了探索，但是還沒有在文本和圖像的大規模生成任務中，證明是一個有競爭力的模型。

Google研究團隊提出了一個全新的離散去噪擴散機率模型（D3PM）。

研究中，作者證明了過度矩陣的選擇是一個重要的設計決策，它能改善圖像和文字領域的結果。

此外，他們也提出了一個新的損失函數，它結合了變分下界和輔助的交叉熵損失。

在文本方面，這個模型在字元級文本生成方面取得了很好的效果，同時可以擴展到大詞彙量的LM1B資料集上。

在CIFAR-10影像資料集上，最新模型接近了連續空間DDPM模型的樣本質量，並超過了連續空間 DDPM 模型的對數似然。

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑圖片

#專案作者

Arnaud Pannatier

擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑

#Arnaud Pannatier從2020年3月在導師François Fleuret的機器學習小組開始攻讀博士學位。

他最近開發了HyperMixer，使用超級網路讓MLPMixer能夠處理各種長度輸入。這使得模型能夠以一種排列不變的方式處理輸入，並證明了它給了模型一種隨著輸入長度線性擴展的注意力行為。

在EPFL，他先後獲得了物理學學士學位和電腦科學與工程碩士學位（CSE-MASH）。

參考資料：

https://www.php.cn/link/46994a3cd8d943d03b44b8fc9792d435

##https://www.php.cn/link/1879d84e181b6262704e95372dc9f4dc#################

以上是擴散模型攻克演算法難題，AGI不遠了！谷歌大腦找到迷宮最短路徑的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

gan agi 網路模型排列

上一篇：徵稿｜ CVPR 2024 Workshop ｜第一屆 Virtual Humans for Robotics and Autonomous Driving 下一篇：從 VR 到 AI：教育科技領域的變革性技術

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

ASFAFASFASFASFASF

2025-02-28 14:37:10
不受歡迎的意見：成為一名好數據科學家比以往任何時候都更難

2025-02-26 03:55:10
DeepSeek-V3解釋了1：多頭潛在註意力

2025-02-26 03:00:17
如何使用Verifai輕鬆部署本地生成搜索引擎

2025-02-25 23:04:13
了解chatgpt的演變：第2部分＆＃8211; GPT-2和GPT-3

2025-02-25 21:02:11
為什麼在長篇小說模型的時代仍然有意義

2025-02-25 19:31:14
超越因果語言建模

2025-02-25 18:28:09
LLMS合成數據生成

2025-02-25 16:54:10
如何重置YouTube算法

2025-02-24 12:34:11
4個智能用途用於舊的Mac

2025-02-24 12:29:09

最新問題

如何使用Yolo V12進行對象檢測？

2025-03-22 11:07:21
2025年2月的Genai推出前5名：GPT-4.5，Grok-3等！

2025-03-22 10:58:15
Uber的指南H3用於空間索引

2025-03-22 10:54:14
R.E.D。：與專家代表團的縮放文本分類

2025-03-22 10:33:09
DeepSeek #opensourceweek第6天：推理系統概述

2025-03-22 10:26:10

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1440045
php入門教程之一週學會PHP

4301422
JAVA 初級入門影片教學

2687662
小甲魚零基礎入門學習Python影片教學

518092
PHP 零基礎入門教學

879806

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板