史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！-人工智慧-PHP中文網

擴散模型的背景

蒸馏无分类器的指导扩散模型

實驗和結論" >實驗和結論

首頁

科技週邊

人工智慧

史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 09, 2023 pm 06:51 PM

Google 模型

最近，無分類器的指導擴散模型(classifier-free guided diffusion models)在高解析度影像產生方面非常有效，並且已經被廣泛用於大規模擴散框架，包括DALL-E 2、 GLIDE和Imagen。

然而，無分類器指導擴散模型的一個缺點是它們在推理時的計算成本很高。因為它們需要評估兩個擴散模型－一個類別條件模型(class-conditional model) 和一個無條件模型(unconditional model)，而且需要評估數百次。

為了解決這個問題，史丹佛大學和Google大腦的學者提出使用兩步驟蒸餾(two-step distillation)的方法來提升無分類器指導擴散模型的取樣效率。

史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！

#論文網址：https://arxiv.org/abs/2210.03142

如何將無分類器指導擴散模型提煉成快速取樣的模型？

首先，對於一個預先訓練好的無分類器指導模型，研究者首先學習了一個單一的模型，來匹配條件模型和無條件模型的組合輸出。

隨後，研究者逐步將這個模型蒸餾成一個取樣步驟更少的擴散模型。

可以看到，在ImageNet 64x64和CIFAR-10上，這種方法能夠在視覺上產生與原始模型相當的圖像。

只需4個取樣步驟，就能獲得與原始模型相當的FID/IS分數，而取樣速度卻高達256倍。

史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！

可以看到，透過改變指導權重w，研究者蒸餾的模型能夠在樣本多樣性和品質之間進行權衡。而且只用一個取樣步驟，就能獲得視覺上愉悅的結果。

擴散模型的背景

透過來自資料分佈史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！的樣本x，雜訊調度函數研究者透過最小化加權均方差來訓練了具有參數θ的擴散模型。

史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！

其中史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！是訊號雜訊比，#是預先指定的加權函數。

一旦訓練了擴散模型史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！，就可以使用離散時間DDIM取樣器從模型中取樣。

具體來說，DDIM取樣器從 z1 ∼ N (0,I)開始，更新如下

史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！

其中，N是采样步骤的总数。使用史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！，会生成最终样本。

无分类器指导是一种有效的方法，可以显著提高条件扩散模型的样本质量，已经广泛应用于包括GLIDE，DALL·E 2和Imagen。

它引入了一个指导权重参数史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！来衡量样本的质量和多样性。为了生成样本，无分类器指导在每个更新步骤都会使用作为预测模型，来评估条件扩散模型和联合训练的。

由于每次采样更新都需要评估两个扩散模型，因此使用无分类器指导进行采样通常很昂贵。

为了解决这个问题，研究者使用了渐进式蒸馏(progressive distillation) ，这是一种通过重复蒸馏提高扩散模型采样速度的方法。

在以前，这种方法不能直接被直接用在引导模型的蒸馏上，也不能在确定性DDIM采样器以外的采样器上使用。而在这篇论文中，研究者解决了这些问题。

蒸馏无分类器的指导扩散模型

他们的办法是，将无分类器的指导扩散模型进行蒸馏。

对于一个训练有素的教师引导模型史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！，他们采取了两个步骤。

第一步，研究者引入了一个连续时间的学生模型史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！，它具有可学习的参数η1，来匹配教师模型在任意时间步长t ∈ [0, 1] 的输出。指定一系列他们有兴趣的指导强度后，他们使用以下目标来优化学生模型。

史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！

其中史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！。

为了结合指导权重w，研究者引入了w条件模型，其中w作为学生模型的输入。为了更好地捕捉特征，他们将傅里叶嵌入应用w，然后用Kingma等人使用的时间步长的方式，把它合并到扩散模型的主干中。

由於初始化在表現中起著關鍵作用，研究者初始化學生模型時，使用的是與教師條件模型相同的參數（除了新引入的與w-conditioning相關的參數）。

第二步，研究者設想了一個離散的時間步長場景，並且透過每次將採樣步數減半，逐步將學習模型從步驟⼀步驟史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！蒸餾成具有可學習參數η2、步⻓更少的學⽣模型。

其中，N表⽰取樣步驟的數量，對於史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！ #和，研究者開始訓練學生模型，讓它用一步來匹配教師模型的兩步DDIM採樣的輸出（例如：從t/N到t - 0.5/N，從t - 0.5/N到t - 1/N）。

將教師模型中的2N個步驟蒸餾成學生模型中的N個步驟以後，我們可以將新的N-step學生模型作為新的教師模型，然後重複同樣的過程，將教師模型蒸餾成N/2-step的學生模型。在每⼀步，研究者都會⽤教師模型的參數來初始化學⽣模型。

N-step的確定性與隨機取樣

⼀旦模型史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！被訓練出來，對於，研究者就可以透過DDIM更新規則來執行採樣。研究者註意到，對於蒸餾模型，這個取樣過程在給定初始化的情況下是確定的。

另外，研究者也可以進行N步驟的隨機取樣。使用兩倍於原始步長的確定性取樣步驟（即與N/2-step確定性取樣器相同），然後使用原始步長進行一次隨機步回（即用雜訊擾動）。

史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！，當t > 1/N時，可用以下的更新規則－

史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！

其中，史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！。

當t=1/N時，研究者使用確定性更新公式，從史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！ #得出。

值得注意的是，我們注意到，與確定性的取樣器相比，執行隨機取樣需要在稍微不同的時間步長內評估模型，並且需要對邊緣情況的訓練演算法進行小的修改。

其他蒸餾⽅法

#還有一個直接將漸進式蒸餾應⽤於引導模型的方法，即遵循教師模型的結構，直接將學⽣模型蒸餾成⼀個聯合訓練的條件和⽆條件模型。研究者嘗試了之後，發現此⽅法效果不佳。

實驗和結論

模型實驗在兩個標準資料集上進行：ImageNet（64*64）和 CIFAR 10。

實驗中探討了指導權重w的不同範圍，並觀察到所有的範圍都有可比性，因此使用[wmin, wmax] = [0, 4]進行實驗。使用訊號雜訊比損失訓練第一步和第二步模型。

基準標準包括DDPM ancestral採樣和DDIM採樣。

為了更好地理解如何納入指導權重w，使用一個固定的w值訓練的模型作為參考。

為了進行公平比較，實驗對所有的方法使用相同的預訓練教師模式。使用U-Net（Ronneberger等人，2015）架構作為基線，並使用相同的U-Net主幹，引入嵌入了w的結構作為兩步驟學生模型。

史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！

上圖為所有方法在ImageNet 64x64上的表現。其中D和S分別代表確定性和隨機性採樣器。

在實驗中，以指導區間w∈[0, 4]為條件的模型訓練，與w為固定值的模型訓練表現相當。在步驟較少時，我們的方法明顯優於DDIM基線效能，在8到16個步驟下基本上達到教師模型的表現水準。

史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！

由FID和IS分數評估的ImageNet 64x64取樣品質

史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！

由FID和IS評分評估的CIFAR-10採樣品質

我們也對教師模型的編碼過程進行蒸餾，並進行了風格轉移的實驗。具體來說，為了在兩個領域A和B之間進行風格轉換，用在領域A上訓練的擴散模型對領域A的圖像進行編碼，然後用在領域B上訓練的擴散模型進行解碼。

史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！

由於編碼過程可以理解為顛倒了的DDIM的採樣過程，我們對具有無分類器指導的編碼器和解碼器都進行了蒸餾，並與DDIM編碼器和解碼器進行比較，如上圖所示。我們也探討了對引導強度w的改動對表現的影響。

總之，我們提出的引導擴散模型的蒸餾方法，以及一種隨機採樣器，從蒸餾後的模型中採樣。從經驗上看，我們的方法只花了一個步驟就能實現視覺上的高體驗採樣，只用8到16個步驟就能獲得與教師相當的FID/IS分數。

以上是史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7469

CakePHP 教程

1376

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

deepseek怎麼評論 Feb 19, 2025 pm 05:42 PM

DeepSeek是一款功能強大的信息檢索工具，其優勢在於能夠深入挖掘信息，但缺點是速度較慢、結果呈現方式較簡單且數據庫覆蓋範圍有限，需要根據具體需求權衡其利弊。

deepseek怎麼搜索 Feb 19, 2025 pm 05:39 PM

DeepSeek是一個專有搜索引擎，僅在特定數據庫或系統中搜索，速度更快，準確性更高。使用時，建議用戶閱讀文檔、嘗試不同的搜索策略、尋求幫助和反饋使用體驗，以便充分利用其優勢。

芝麻開門交易所網頁註冊鏈接 gate交易app註冊網址最新 Feb 28, 2025 am 11:06 AM

本文詳細介紹了芝麻開門交易所（Gate.io）網頁版和Gate交易App的註冊流程。無論是網頁註冊還是App註冊，都需要訪問官方網站或應用商店下載正版App，然後填寫用戶名、密碼、郵箱和手機號等信息，並完成郵箱或手機驗證。

Bybit交易所鏈接為什麼不能直接下載安裝？ Feb 21, 2025 pm 10:57 PM

為什麼Bybit交易所鏈接無法直接下載安裝？ Bybit是一個加密貨幣交易所，為用戶提供交易服務。該交易所的移動應用程序不能直接通過AppStore或GooglePlay下載，原因如下：1.應用商店政策限制蘋果公司和谷歌公司對應用商店中允許的應用程序類型有嚴格的要求。加密貨幣交易所應用程序通常不符合這些要求，因為它們涉及金融服務，需要遵循特定的法規和安全標準。 2.法律法規合規在許多國家/地區，與加密貨幣交易相關的活動都受到監管或限制。為了遵守這些規定，Bybit應用程序只能通過官方網站或其他授權渠

芝麻開門交易平台下載手機版 gateio交易平台下載地址 Feb 28, 2025 am 10:51 AM

選擇正規渠道下載App，保障您的賬戶安全至關重要。

加密數字資產交易APP推薦top10（2025全球排名） Mar 18, 2025 pm 12:15 PM

本文推荐十大值得关注的加密货币交易平台，涵盖币安(Binance)、OKX、Gate.io、BitFlyer、KuCoin、Bybit、Coinbase Pro、Kraken、BYDFi和XBIT去中心化交易所。这些平台在交易币种数量、交易类型、安全性、合规性、特色功能等方面各有千秋，例如币安以其全球最大的交易量和丰富的功能著称，而BitFlyer则凭借其日本金融厅牌照和高安全性吸引亚洲用户。选择合适的平台需要根据自身交易经验、风险承受能力和投资偏好进行综合考量。希望本文能帮助您找到最适合自

幣安binance官網最新版登錄入口 Feb 21, 2025 pm 05:42 PM

訪問幣安官方網站最新版登錄入口，只需遵循這些簡單步驟。前往官方網址，點擊右上角的“登錄”按鈕。選擇您現有的登錄方式，如果是新用戶，請“註冊”。輸入您的註冊手機號或郵箱和密碼，並完成身份驗證（例如手機驗證碼或谷歌身份驗證器）。成功驗證後，即可訪問幣安官方網站的最新版登錄入口。

2025年Bitget最新下載地址：獲取官方App的步驟 Feb 25, 2025 pm 02:54 PM

本指南提供了 Bitget 交易所官方 App 的詳細下載和安裝步驟，適用於安卓和 iOS 系統。指南整合了來自多個權威來源的信息，包括官網、App Store 和 Google Play，並強調了下載和賬戶管理過程中的注意事項。用戶可以從官方渠道下載 App，包括應用商店、官網 APK 下載和官網跳轉，並完成註冊、身份驗證和安全設置。此外，指南還涵蓋了常見問題和注意事項，例如

See all articles

史丹佛/Google大腦：兩次蒸餾，引導擴散模型採樣提速256倍！

擴散模型的背景

蒸馏无分类器的指导扩散模型

實驗和結論

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題