Stability AI 推出 Stable Diffusion XL Turbo 模型
IT之家於11月30日報道,Stability AI最近推出了Stable Diffusion XL Turbo(SDXL Turbo),是先前SDXL車型的改良版。據稱,SDXL Turbo採用了“對抗性擴散蒸餾技術(Adversarial Diffusion Distillation)”,使得圖片生成的迭代步驟從原來的50步減少到了1步,據稱“只需進行一次迭代步驟即可生成高品質圖像”
據悉,Stable Diffusion XL Turbo 模型的最大特點,就是上述“一次迭代生成圖像”,號稱可以進行“即時文字轉圖像輸出”,並能夠保證圖片的品質。
需要進行改寫的是:其中一項被稱為“對抗性擴散蒸餾技術”,它是利用現有的大型圖像擴散模型作為“教師網絡”,指導生成過程的技術。這項技術結合了“蒸餾技術”和“對抗訓練”,其中“蒸餾技術”是指將大型模型的知識濃縮到更小的模型中,以精簡模型的輸出。而對抗性訓練可以改進模型,使其能夠更好地模仿教師模型的輸出
先前的模型蒸餾技術難以兼顧效率和品質,這是因為快速採樣通常會削弱輸出品質,因此本次Stable Diffusion XL Turbo 模型在透過「對抗性擴散蒸餾技術」在高效生成高品質影像方面,是一個重要的進步。
官方將Stable Diffusion XL Turbo 與多個不同的模型變體進行比較,包括StyleGAN-T 、OpenMUSE、IF-XL、SDXL 和LCM-XL,並進行了兩項實驗,第一個實驗要求模型評估人員隨機查看兩個模型的輸出,並選擇其中最符合提示詞的輸出圖像,第二項實驗則與第一個實驗執行大致相同,模型評估要求選擇模型中輸出者圖像品質最佳的一方。
▲ 圖片來自 Stability AI 部落格
經實驗結果顯示,Stable Diffusion XL Turbo 能夠在顯著降低運算需求的同時,依然保持出色的影像產生品質。相較於經過 4 次迭代的 LCM-XL,模型僅需一次迭代即可超越。而經過 4 次迭代的 Stable Diffusion XL Turbo 則可輕鬆擊敗先前需要經過 50 次迭代配置的 Stable Diffusion XL。在使用 A100 GPU 進行 512x512 解析度的影像運算時,只需 207 毫秒即可完成
IT之家注意到,目前 Stability AI 已經將相關代碼公佈在 Hugging Face,供個人和非商業用途使用,有興趣的小伙伴們可以點此訪問。
以上是Stability AI 推出 Stable Diffusion XL Turbo 模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

Vibe編碼通過讓我們使用自然語言而不是無盡的代碼行創建應用程序來重塑軟件開發的世界。受Andrej Karpathy等有遠見的人的啟發,這種創新的方法使Dev

2025年2月,Generative AI又是一個改變遊戲規則的月份,為我們帶來了一些最令人期待的模型升級和開創性的新功能。從Xai的Grok 3和Anthropic的Claude 3.7十四行詩到Openai的G

Yolo(您只看一次)一直是領先的實時對象檢測框架,每次迭代都在以前的版本上改善。最新版本Yolo V12引入了進步,可顯著提高準確性

Chatgpt 4當前可用並廣泛使用,與諸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和產生連貫的響應方面取得了重大改進。未來的發展可能包括更多個性化的間

Google DeepMind的Gencast:天氣預報的革命性AI 天氣預報經歷了巨大的轉變,從基本觀察到復雜的AI驅動預測。 Google DeepMind的Gencast,開創性

本文討論了AI模型超過Chatgpt,例如Lamda,Llama和Grok,突出了它們在準確性,理解和行業影響方面的優勢。(159個字符)

本文回顧了AI最高的藝術生成器,討論了他們的功能,對創意項目的適用性和價值。它重點介紹了Midjourney是專業人士的最佳價值,並建議使用Dall-E 2進行高質量的可定製藝術。

Openai的O1:為期12天的禮物狂歡始於他們迄今為止最強大的模型 12月的到來帶來了全球放緩,世界某些地區的雪花放緩,但Openai才剛剛開始。 山姆·奧特曼(Sam Altman)和他的團隊正在推出12天的禮物前
