首页 科技周边 人工智能 与Dreambooth和Lora进行微调稳定的扩散XL

与Dreambooth和Lora进行微调稳定的扩散XL

Mar 09, 2025 am 09:55 AM

>本教程探索稳定的扩散XL(SDXL)和Dreambooth,演示了如何利用图像生成和模型微调的diffusers库。 我们将使用个人照片微调SDXL并评估结果。 鼓励AI新移民从AI基础课程开始。>

理解稳定的扩散xl >

稳定性AI的SDXL 1.0代表了AI文本对图像生成的显着飞跃。 在仅研究的SDXL 0.9的基础上,它是最强大的公开图像创建模型。 与其他开源替代方案相比,广泛的测试证实了其优越的图像质量。

>

Fine-tuning Stable Diffusion XL with DreamBooth and LoRA 来自arxiv.org

> >的图像 这种提高的质量源于两个模型的合奏:35亿个参数基础发生器和66亿个参数炼油厂。这种双重方法优化了图像质量,同时保持消费者GPU的效率。 SDXL 1.0简化了图像的生成,从简明提示产生复杂的结果。 自定义数据集还精简,提供了对图像结构,样式和构图的颗粒状控制。

> Dreambooth:个性化图像生成

Google的Dreambooth(2022)是生成AI的突破,特别是对于稳定扩散等文本到图像模型。 正如Google的研究人员所描述的那样:“这就像一个照相亭,但以使其能够在您的梦想带到您的任何地方合成的方式捕获主题。”

来自Dreambooth

>的图像

Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

> Dreambooth将自定义主题注入模型,为特定人员,对象或场景创建专门的发电机。 培训仅需要几张(3-5)张图像。 然后,受过训练的模型将主题置于不同的环境和摆姿势,仅受想象中的限制。

> Dreambooth应用程序

> Dreambooth的可自定义图像生成受益于各个领域:

创意产业:

图形设计,广告和娱乐活动从其独特的视觉内容创建功能中受益。

    个性化:
  1. 在现实或纯粹的虚构设置中创建难以复制或不可能的场景。
  2. 教育与研究:
  3. 生成个性化的教育内容和艾滋病研究,需要视觉代表。
  4. 访问稳定的扩散xl
  5. > 可以通过拥抱的面部空间演示访问SDXL(从提示符生成四个图像)或python库,用于自定义提示图。

    >设置和图像生成diffusers

    >

    确保可用的GPU可用:

    !nvidia-smi
    登录后复制

    Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

    > install

    diffusers

    %pip install --upgrade diffusers[torch] -q
    登录后复制
    >加载模型(使用FP16用于GPU存储器效率):>

    生成图像:
    from diffusers import DiffusionPipeline, AutoencoderKL
    import torch
    
    vae = AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16)
    pipe = DiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0", vae=vae, torch_dtype=torch.float16, variant="fp16", use_safetensors=True)
    pipe.to("cuda");
    登录后复制

    >使用辅助功能显示图像(在原始功能中提供):>
    prompt = "A man in a spacesuit is running a marathon in the jungle."
    image = pipe(prompt=prompt, num_inference_steps=25, num_images_per_prompt=4)
    登录后复制

    # ... (image_grid function from original code) ...
    image_grid(image.images, 2, 2)
    登录后复制

    Fine-tuning Stable Diffusion XL with DreamBooth and LoRA 改善炼油厂的结果

    以提高质量,使用SDXL炼油厂:

    # ... (refiner loading and processing code from original) ...
    登录后复制

    > autotrain Advanced Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

    微调SDXL Autotrain Advanced简化了SDXL微调。 使用:

    安装它 (注意:原始教程使用现已过时的Colab笔记本作为替代方法;这是为了简洁而省略的。)

    Dreambooth微调(删节)
    %pip install -U autotrain-advanced
    登录后复制

    然后,该教程在图像的个人数据集上使用Autotrain Advance的Dreambooth脚本进行了微调SDXL的详细示例。本节涉及设置变量,创建Kaggle数据集并运行自动辅助脚本。 输出显示了训练过程以及由此产生的洛拉(Lora)举重上传到拥抱的脸。 然后演示使用微调模型的推断,在各种情况下展示了指定主题的生成图像。 最后,探索了炼油厂与微调模型的使用。 由于长度的限制,此详细的部分在此处显着凝结。 请参阅原始代码和解释。

    结论

    本教程提供了SDXL和Dreambooth的全面概述,展示了它们的功能,并易于使用>

以上是与Dreambooth和Lora进行微调稳定的扩散XL的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1653
14
CakePHP 教程
1413
52
Laravel 教程
1306
25
PHP教程
1251
29
C# 教程
1224
24
开始使用Meta Llama 3.2 -Analytics Vidhya 开始使用Meta Llama 3.2 -Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

10个生成AI编码扩展,在VS代码中,您必须探索 10个生成AI编码扩展,在VS代码中,您必须探索 Apr 13, 2025 am 01:14 AM

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

向员工出售AI策略:Shopify首席执行官的宣言 向员工出售AI策略:Shopify首席执行官的宣言 Apr 10, 2025 am 11:19 AM

Shopify首席执行官TobiLütke最近的备忘录大胆地宣布AI对每位员工的基本期望是公司内部的重大文化转变。 这不是短暂的趋势。这是整合到P中的新操作范式

AV字节:Meta' llama 3.2,Google的双子座1.5等 AV字节:Meta' llama 3.2,Google的双子座1.5等 Apr 11, 2025 pm 12:01 PM

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

GPT-4O vs OpenAI O1:新的Openai模型值得炒作吗? GPT-4O vs OpenAI O1:新的Openai模型值得炒作吗? Apr 13, 2025 am 10:18 AM

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

视觉语言模型(VLMS)的综合指南 视觉语言模型(VLMS)的综合指南 Apr 12, 2025 am 11:58 AM

介绍 想象一下,穿过​​美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

如何在SQL中添加列? - 分析Vidhya 如何在SQL中添加列? - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

阅读AI索引2025:AI是您的朋友,敌人还是副驾驶? 阅读AI索引2025:AI是您的朋友,敌人还是副驾驶? Apr 11, 2025 pm 12:13 PM

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年

See all articles