Stability AI 推出 Stable Diffusion XL Turbo 模型
IT之家于11月30日报道,Stability AI最近推出了Stable Diffusion XL Turbo(SDXL Turbo),这是之前SDXL模型的改进版本。据称,SDXL Turbo采用了“对抗性扩散蒸馏技术(Adversarial Diffusion Distillation)”,使得图片生成的迭代步骤从原来的50步减少到了1步,据称“只需进行一次迭代步骤即可生成高品质图像”
据悉,Stable Diffusion XL Turbo 模型的最大特点,就是上述“一次迭代生成图像”,号称可以进行“即时文字转图像输出”,并能够保证图片的质量。
需要进行改写的是:其中一项被称为“对抗性扩散蒸馏技术”,它是利用现有的大型图像扩散模型作为“教师网络”,指导生成过程的技术。这项技术结合了“蒸馏技术”和“对抗训练”,其中“蒸馏技术”是指将大型模型的知识浓缩到更小的模型中,以精简模型的输出。而对抗性训练可以改进模型,使其能够更好地模仿教师模型的输出
此前的模型蒸馏技术难以兼顾效率和品质,这是因为快速采样通常会削弱输出品质,因此本次 Stable Diffusion XL Turbo 模型在通过“对抗性扩散蒸馏技术”在高效生成高品质图像方面,是一个重要的进步。
官方将 Stable Diffusion XL Turbo 与多个不同的模型变体进行比较,包括 StyleGAN-T++、OpenMUSE、IF-XL、SDXL 和 LCM-XL,并进行了两项实验,第一个实验要求模型评估人员随机查看两项模型的输出,并选择出其中最符合提示词的输出图像,第二项实验则与第一项实验执行大致相同,模型评估要求选择模型中输出者图像品质最佳的一方。
▲ 图片来源于 Stability AI 博客
经实验结果显示,Stable Diffusion XL Turbo 能够在显著降低计算需求的同时,依然保持出色的图像生成质量。相较于经过 4 次迭代的 LCM-XL,该模型仅需一次迭代即可超越。而经过 4 次迭代的 Stable Diffusion XL Turbo 则可轻松击败之前需要经过 50 次迭代配置的 Stable Diffusion XL。在使用 A100 GPU 进行 512x512 分辨率的图像计算时,仅需 207 毫秒即可完成
IT之家注意到,目前 Stability AI 已经将相关代码公布在 Hugging Face,供个人和非商业用途使用,感兴趣的小伙伴们可以点此访问。
以上是Stability AI 推出 Stable Diffusion XL Turbo 模型的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

Vibe编码通过让我们使用自然语言而不是无尽的代码行创建应用程序来重塑软件开发的世界。受Andrej Karpathy等有远见的人的启发,这种创新的方法使Dev

2025年2月,Generative AI又是一个改变游戏规则的月份,为我们带来了一些最令人期待的模型升级和开创性的新功能。从Xai的Grok 3和Anthropic的Claude 3.7十四行诗到Openai的G

Yolo(您只看一次)一直是领先的实时对象检测框架,每次迭代都在以前的版本上改善。最新版本Yolo V12引入了进步,可显着提高准确性

Chatgpt 4当前可用并广泛使用,与诸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和产生连贯的响应方面取得了重大改进。未来的发展可能包括更多个性化的间

Google DeepMind的Gencast:天气预报的革命性AI 天气预报经历了巨大的转变,从基本观察到复杂的AI驱动预测。 Google DeepMind的Gencast,开创性

本文讨论了AI模型超过Chatgpt,例如Lamda,Llama和Grok,突出了它们在准确性,理解和行业影响方面的优势。(159个字符)

本文回顾了AI最高的艺术生成器,讨论了他们的功能,对创意项目的适用性和价值。它重点介绍了Midjourney是专业人士的最佳价值,并建议使用Dall-E 2进行高质量的可定制艺术。

Openai的O1:为期12天的礼物狂欢始于他们迄今为止最强大的模型 12月的到来带来了全球放缓,世界某些地区的雪花放缓,但Openai才刚刚开始。 山姆·奥特曼(Sam Altman)和他的团队正在推出12天的礼物前
