目录
教程简述
使用PAI-DSW快速启动SD WebUI
首页 科技周边 人工智能 利用PAI-DSW和SD WebUI实现AI扩图功能的方法

利用PAI-DSW和SD WebUI实现AI扩图功能的方法

Jan 17, 2024 am 11:15 AM

教程简述

在本教程中,您将学习如何在阿里云交互式建模(PAI-DSW)中,使用Stable-Diffusion-WebUI实现AI扩图功能。

随着AIGC技术的不断发展,AI扩图成为了一种创新玩法。通过给AI一张图片,AI能够预测和补充图像边界,生成更大尺寸的图像。AI扩图能够拯救废片,将半身照扩展为全身照,但有时也会出现翻车情况,生成的图像让人哭笑不得。

本教程使用Stable Diffusion WebUI实现AI扩图功能效果展示如下:

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

基于本教程可以体验:

新用户可免费领取价值万元的人工智能平台PAI 试用资源

学会如何快速在阿里云上创建一个交互式训练开发环境。

学会如何在DSW中启动WebUI。

学会如何在DSW实现AI扩图功能。

使用PAI-DSW快速启动SD WebUI

1. 准备环境和资源

1.1 领取交互式建模PAI-DSW免费试用权益

前往活动页面,领取交互式建模PAI-DSW产品免费试用资源包

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

  • 对于交互式建模 PAI-DSW 的新用户,阿里云提供了5000CU*H 的免费试用资源,可以在活动页面中直接领取(试用规则请参照阿里云免费试用:https://free.aliyun.com/);或可以购买交互式建模 PAI-DSW 资源包参与活动,购买链接:PAI-DSW 100CU*H资源包,价格 59 元起;如不购买资源包,PAI-DSW 会按量进行计费,计费标准详见阿里云产品定价。

1.2 创建PAI-DSW实例

  1. 前往人工智能平台PAI控制台,链接:https://pai.console.aliyun.com/
  2. 开通人工智能PAI并创建默认工作空间。请参见开通并创建默认工作空间。
  3. 在人工智能平台PAI控制台内,选择交互式建模PAI-DSW,或点击链接

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

4.点击创建实例(如上图)

5.自定义输入实例名称

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

6.选择实例机型,GPU分类-ecs.gn6v-c8g1.2xlarge(支持资源包抵扣),若无此机型库存可更换地域尝试;

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

7.选择镜像,stable-diffusion-webui-develop:1.0.0-pytorch2.01-gpu-py310-cu117-ubuntu22.04

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

8.点击“下一步”

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

9.确认【资源配置】及【镜像】如图所示,点击创建实例;

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

10.大约等到3-5分钟,实例状态变为「运行中」,实例创建完成;

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

1.3 在DSW中打开教程文件

  1. 单击需要打开的实例操作列下的打开,进入PAI-DSW实例开发环境。
  2. Notebook页签的Launcher页面,单击快速开始区域Tool下的浏览Gallery,打开Gallery页面

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

3.在DSW Gallery页面中,搜索并找到AI扩图神器:放飞你的想象力教程,单击教程卡片中的在DSW中打开。

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

4.右侧出现文件夹“demos”,点击“demos”文件夹,点击“stable_diffusion_inpaint”文件夹,点击“stable_diffusion_inpaint.ipynb”文件,打开已编写好的Notebook最佳实践教程,具体步骤如下图所示

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

5.完成以上步骤,顺利打开AI扩图神器:放飞你的想象力 Notebook最佳实践。

1.4 运行教程文件

  1. 在打开的教程文件stable_diffusion_inpaint.ipynb文件中,您可以直接看到教程文本,您可以在教程文件中直接运行每个代码片段。当成功运行结束一个步骤命令后,再顺次运行下个步骤的命令。

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

2.本教程一共3个运行步骤:

  1. 下载stable-diffusion-webui开源库
  2. 下载模型
  3. 启动WebUI

3.当第3步启动WebUI运行完成后,在返回的运行详情结果中单击URL链接,进入WebUI页面。后续您可以在该页面完成AI扩图。

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

2. 完成部署开始体验AI扩图

为了实现AI扩图的能力,需要在Stable Diffusion WebUI页面进行如下配置。

2.1 进入图生图界面

进入图生图界面,Stable Diffusion模型和模型的VAE保持默认即可。

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

2.2 基本配置

图生图配置,完成图片上传和图生图参数配置。具体参考下图。

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

1.缩放模式:选择填充。

2.重绘幅度:选择1.0。 — 通常来说,重绘幅度参数越大,生成的图片和原来的图片相似度越低,但使用controlnet inpaint扩图时,需要拉满。

3.宽度和高度:填写扩图后的大小。

  • 请根据原图尺寸以及扩图需求来设置尺寸。注意,扩图时原图片的比例不能保持相同。
  • 本例设置宽度为1024,高度为512,期待看到图像水平延展的结果。

2.3 ControlNet配置

接下来,需要配置ControlNet,参数如下:

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

  • 选择启用、Upload independent control image和Pixel Perfect。前两者是为了让ControlNet通过图片控制生图,后者是为了改善生成效果。这里上传跟上文一样的图片。
  • Controltype:选择局部重绘。
  • 预处理器:选择inpaint_only。
  • 模型:选择control_v11p_sd15_inpaint,这是SD1.5的ControlNet扩图模型。
  • ControlMode:选择Controlnet更重要。
  • 画面缩放模式:选择调整大小并填充。

2.4 输入prompt,完成AI扩图

按照个人喜好,输入正向及负向prompt,完成AI扩图,以下为示例参考。

heart-shape balloons——心形气球

Christmas tree——圣诞树

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

本次活动主题:AI扩图后,图片里有一颗树。请由人工智能平台PAI(PAI-DSW)完成AI扩图后,上传符合活动主题的作品至活动页面 >> 「和PAI一起,每周玩转AI」第五期:使用 PAI-DSW 实现AI扩图功能

3. 资源清理及后续

3.1 清理

  • 在实验完成后,可前往对应产品控制台,停止或删除实例(两个操作均可),避免实例持续处于运行中,在超出免费试用额度后,带来额外的扣费

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

  • 后续仍考虑使用该实例>>停止;后续不再使用该实例>>删除,成功停止后即停止资源消耗。

3.2 后续

在试用有效期期间,您还可以继续使用DSW实例进行模型训练和推理验证。

原文链接:https://developer.aliyun.com/article/1417423?utm_content=g_1000388102

本文为阿里云原创内容,未经允许不得转载。

以上是利用PAI-DSW和SD WebUI实现AI扩图功能的方法的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
2 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
2 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

我尝试了使用光标AI编码的Vibe编码,这太神奇了! 我尝试了使用光标AI编码的Vibe编码,这太神奇了! Mar 20, 2025 pm 03:34 PM

Vibe编码通过让我们使用自然语言而不是无尽的代码行创建应用程序来重塑软件开发的世界。受Andrej Karpathy等有远见的人的启发,这种创新的方法使Dev

如何使用DALL-E 3:技巧,示例和功能 如何使用DALL-E 3:技巧,示例和功能 Mar 09, 2025 pm 01:00 PM

DALL-E 3:生成的AI图像创建工具 Generative AI正在彻底改变内容的创建,而Openai最新的图像生成模型Dall-E 3处于最前沿。它于2023年10月发行,建立在其前任Dall-E和Dall-E 2上

2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! 2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! Mar 22, 2025 am 10:58 AM

2025年2月,Generative AI又是一个改变游戏规则的月份,为我们带来了一些最令人期待的模型升级和开创性的新功能。从Xai的Grok 3和Anthropic的Claude 3.7十四行诗到Openai的G

如何使用Yolo V12进行对象检测? 如何使用Yolo V12进行对象检测? Mar 22, 2025 am 11:07 AM

Yolo(您只看一次)一直是领先的实时对象检测框架,每次迭代都在以前的版本上改善。最新版本Yolo V12引入了进步,可显着提高准确性

Elon Musk&Sam Altman冲突超过5000亿美元的星际之门项目 Elon Musk&Sam Altman冲突超过5000亿美元的星际之门项目 Mar 08, 2025 am 11:15 AM

这项耗资5000亿美元的星际之门AI项目由OpenAI,Softbank,Oracle和Nvidia等科技巨头支持,并得到美国政府的支持,旨在巩固美国AI的领导力。 这项雄心勃勃

Sora vs veo 2:哪个创建更现实的视频? Sora vs veo 2:哪个创建更现实的视频? Mar 10, 2025 pm 12:22 PM

Google的VEO 2和Openai的Sora:哪个AI视频发电机占据了至尊? 这两个平台都产生了令人印象深刻的AI视频,但它们的优势在于不同的领域。 使用各种提示,这种比较揭示了哪种工具最适合您的需求。 t

Google的Gencast:Gencast Mini Demo的天气预报 Google的Gencast:Gencast Mini Demo的天气预报 Mar 16, 2025 pm 01:46 PM

Google DeepMind的Gencast:天气预报的革命性AI 天气预报经历了巨大的转变,从基本观察到复杂的AI驱动预测。 Google DeepMind的Gencast,开创性

哪个AI比Chatgpt更好? 哪个AI比Chatgpt更好? Mar 18, 2025 pm 06:05 PM

本文讨论了AI模型超过Chatgpt,例如Lamda,Llama和Grok,突出了它们在准确性,理解和行业影响方面的优势。(159个字符)

See all articles