目录
教程简述
使用PAI 快速启动 EasyPhoto
首页 科技周边 人工智能 PAI x EasyPhoto, 告别愚人节,创造节日氛围AI写真

PAI x EasyPhoto, 告别愚人节,创造节日氛围AI写真

Jan 03, 2024 pm 09:18 PM

活动地址:https://developer.aliyun.com/topic/aigc_pai/newyear

教程简述

生成式AI技术批量产出真/像/美的个人写真应用非常受欢迎。近期上线的EasyPhoto 作为一款开源的 SD WebUI 插件,提供更灵活、易用的开发方式,受到大量开发者们的关注和好评,用户可通过上传若干张同一人的照片,即可快速训练 LoRA 模型,并结合用户自定义的模板图片,最终生成真、像、美的写真照片。

EasyPhoto 是一个Webui UI插件,用于生成AI肖像画。基于StableDiffusion + 人物定制Lora + ControlNet 的方式实现,支持低代码操作、自定义风格,内置丰富模版,让更多开发者可以灵活地开发自己的风格化的艺术照生成。 本次AIGC创作活动基于阿里云人工智能平台PAI,低代码高效率启动EasyPhoto,实现节日氛围美图的快速生成。

基于本教程可以体验:

新用户可免费领取价值万元的人工智能平台PAI试用资源

基于交互式建模PAI-DSW 训练个人专属的 LoRA 模型

创作全新的节日AI写真,让您体验到圣诞节、新年等节日充满个性化氛围的感觉

提交作品Redmi Watch3、小米手环8等赢取精美好礼!

使用PAI 快速启动 EasyPhoto

1. 准备工作

1.1 领取交互式建模PAI-DSW免费试用权益

前往本次「hi 2024!AI新年写真大挑战」活动页面,领取交互式建模PAI-DSW产品免费试用资源包

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • 对于交互式建模 PAI-DSW 的新用户,阿里云提供了5000CU*H 的免费试用资源,可以在活动页面中直接领取(试用规则请参照阿里云免费试用:https://free.aliyun.com/);或可以购买交互式建模 PAI-DSW 资源包参与活动,购买链接:PAI-DSW 100CU*H资源包,价格 59 元起;如不购买资源包,PAI-DSW 会按量进行计费,计费标准详见阿里云产品定价。

1.2 创建PAI-DSW实例

  1. 前往人工智能平台PAI控制台,链接:https://pai.console.aliyun.com/
  2. 开通人工智能PAI并创建默认工作空间。请参见开通并创建默认工作空间。
  3. 在人工智能平台PAI控制台内,选择交互式建模PAI-DSW

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

4.点击创建实例(如上图)

5.自定义输入实例名称,如“easyphoto”

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

在选择实例机型时,可以考虑使用GPU分类的ecs.gn6v-c8g1.2xlarge(支持资源包抵扣)或ecs.gn7i-c8g1.2xlarge

(支持资源包抵扣)。若这两个机型库存可更换地域尝试,或选择其他付费机型(不支持免费试用)。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

7.选择镜像,stable-diffusion-webui-develop:1.0.0-pytorch2.01-gpu-py310-cu117-ubuntu22.04

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

8.点击“下一步”

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

9.确认【资源配置】及【镜像】如图所示,点击创建实例;

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

10.大约等到3-5分钟,实例状态变为「运行中」,实例创建完成;

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

1.3 在PAI-DSW中打开EasyPhoto教程,体验零代码完成AI开发

  1. 打开链接:基于EasyPhoto的AI新年-圣诞写真大挑战 (WebUI版),点击右上角「在阿里云DSW打开」

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

2.选择先前创建好的实例,点击实例名称

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

3.进入notebook开发界面,逐步点击运行按钮;依次运行 1.环境安装 节的单元格(3个 定义函数-下载代码-下载模型),可下载并安装预置的带有EasyPhoto插件的WebUI,即所依赖的模型。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

4.运行 2.启动WebUI 节的单元格,可打开WebUI。

5.单击生成的链接进入WebUI

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • 打开WebUI,进入体验环节,在WebUI里运行EasyPhoto;

2. 开始体验

您可以使用本教程生成自己的节日写真/动图,我们提供了如下的功能:

  • 人物写真(Photo Inference)
  • 指定图片的人物写真 (Photo2Photo)
  • 指定文本的人物写真 (Text2Photo)
  • 人物动图(Video Inference)
  • 指定文本的人物动图 (Text2Video)
  • 指定图片的人物动图 (Image2Video)
  • 指定视频的人物动图 (Video2Video)

大体上,人物写真/动图的生成分为以下两个步骤:

  • Step1: 训练属于人物的数字分身
  • Step2: 基于数字分身进行图像/视频生成

生成图片请参考2.2板块,生成视频请参考2.3板块。

2.1 数字分身训练

  • Step1: 点击EasyPhoto选项卡
  • Step2: 点击Upload Photos 上传自己的训练图片 (5-20张清晰的人像,最好为半身/正面)

如果没有10张个人清晰人像照片,可以选择蒙娜丽莎照片作为测试。蒙娜丽莎照片的下载链接为:https://pai-aigc-photog.oss-cn-hangzhou.aliyuncs.com/webui/mona.zip

  • Step3: 点击Start Training (在弹框中输入任意的user id (英文))

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

我们为您内置了写实/动漫风格的两种基模型供您选择,您也可以根据喜好选择自己的基模型。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

⚠️请注意,如在训练过程中出现如图所示的前端断连,不用担心,您可在notebook后台看见训练进度。待训练完成后刷新前端页面可以进行模型推理。

  • 前端断连(连接超时 确保后台在训练即可):

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • 训练完成提醒:
  • SDWebUI 前端

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • notebook后端

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

2.2 图像推理 (Photo Inference)

您可使用Photo Inference 进行图像推理,我们支持:

  • 指定图像的人物写真(Photo2Photo)
  • 指定文本的人物写真(Text2Photo)

2.2.1 人物写真的指定图像

  • Step 1: 切到Photo inference选项卡
  • Step 2: 选择一种合适的图片上传方式
  • 从模版中选择(Template Gallery),需在Gallery中选择一张图片
  • 自行上传单张(Single Image Upload)
  • 批量上传模版(Batch Image Upload)

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step 3: 选择基模型和UserId对应的LoRA模型 (可点击 刷新 图标 获得所有的UserID列表)

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • 使用Infer With IPA时 无需训练自己的数字分身,直接在弹出的图片框中上传一张图进行生成。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step 4: 可在Advanced Option选项卡中设置相关的参数
  • 可打开background restore,并调整重绘幅度,对模版图片进行重绘来达到不同的生成效果。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step 5: 点击Start Generation 进行模型推理,生成专属于您的AI写真
  • 稍等约1-2分钟后,图片生成完成,可下载存储图片;

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step6: 您可进一步选择生成图片,单击Text Options,选择一个合适的模版添加艺术字效果,生成的结果将出现在Results 的右侧。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • 将图片提交至活动页,参与评奖活动;

⚠️ 若出现如下提示,请设置ControlNet 数目>=4。在控制台退出并重启WebUI进行设置。

  • Step1: 选择 设置 菜单
  • Step2: 在左侧菜单栏中找到ControlNet
  • Step3: 将Multi-ControlNet数目设置>=4
  • Step4: 点击保存设置
  • Step5: 回到notebook页面,停止并重新启动SDWebUI

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

2.2.2 指定文本的人物写真

  • Step 1: 切到Text2Photo选项卡
  • Step 2: 选择一种合适的场景
  • Step 3: 修改相关的文本描述

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step4: 设置生成图像分辨率
  • Step5: 进一步选择/上传 控制图像(姿态控制 OpenPose)

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step6: 与图生图一致的设置 基模型/User_id 及其他参数,进行图像生成,并在生成完成后自行添加艺术字效果。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

* 您可以参考这里的使用方式来进一步训练自己的节日场景,多样化的生成人像写真~

2.3 视频推理 (Video Inference)

您可使用Video Inference 进行视频推理,我们支持:

  • 指定文本的人物动图(Text2Video)
  • 指定图像的人物动图(Image2Video)
  • 指定视频的人物动图(Video2Video)

2.3.1 指定文本的人物动图

  • Step 1: 切到Video inference选项卡
  • Step 2: 选择一个合适的场景,并修改相应的prompy(与 指定文本的人物写真 操作相同)
  • Step 3: 设置图像大小,或上传一个用于控制的视频,并选择合适的控制方式。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step 4: 设置基模型、user_id 以及相关的参数。

⚠️ 我们默认打开了lcm 用于视频生成的加速,您可关闭该选项用更多的生成步数来生成更细节的视频结果。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step 5: 点击 Start Generation 来生成视频
  • 如前端错误,后台显示生成完成,您可单击 List Recent Conversion Results 来下载/查看 生成的历史视频。(无需刷新)

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step 6: 点击 Text Option 来对生成视频添加艺术字效果。您可以选择某一帧,或将艺术字效果应用于整段视频。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

2.3.2 指定图像的人物动图

  • Step1: 上传一张 人物图 (可通过 按钮 将生成的人物写真发送至此)/ 上传首、尾图

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step2: 设置基模型、user_id 及相关参数。点击Start Generation 可进行视频的生成。并使用Text Options进行艺术字的添加。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

2.3.3 指定视频的人物动图

  • Step1: 上传一段人物视频
  • Step2: 设置基模型、user_id 及相关参数。点击Start Generation 可进行视频的生成。并使用Text Options进行艺术字的添加。

3. 资源清理及后续

3.1 清理

  • 在实验完成后,可前往对应产品控制台,停止或删除实例(两个操作均可),避免实例持续处于运行中,在超出免费试用额度后,带来额外的扣费

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • 后续仍考虑使用该实例>>停止;后续不再使用该实例>>删除,成功停止后即停止资源消耗。

3.2 后续

在试用有效期期间,您还可以继续使用DSW实例进行模型训练和推理验证。

附:

欢迎共建 EasyPhoto, Github地址:https://github.com/aigc-apps/sd-webui-EasyPhoto

原文链接:https://developer.aliyun.com/article/1401917?utm_content=g_1000386818

本文为阿里云原创内容,未经允许不得转载。

以上是PAI x EasyPhoto, 告别愚人节,创造节日氛围AI写真的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

我尝试了使用光标AI编码的Vibe编码,这太神奇了! 我尝试了使用光标AI编码的Vibe编码,这太神奇了! Mar 20, 2025 pm 03:34 PM

Vibe编码通过让我们使用自然语言而不是无尽的代码行创建应用程序来重塑软件开发的世界。受Andrej Karpathy等有远见的人的启发,这种创新的方法使Dev

2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! 2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! Mar 22, 2025 am 10:58 AM

2025年2月,Generative AI又是一个改变游戏规则的月份,为我们带来了一些最令人期待的模型升级和开创性的新功能。从Xai的Grok 3和Anthropic的Claude 3.7十四行诗到Openai的G

如何使用Yolo V12进行对象检测? 如何使用Yolo V12进行对象检测? Mar 22, 2025 am 11:07 AM

Yolo(您只看一次)一直是领先的实时对象检测框架,每次迭代都在以前的版本上改善。最新版本Yolo V12引入了进步,可显着提高准确性

Chatgpt 4 o可用吗? Chatgpt 4 o可用吗? Mar 28, 2025 pm 05:29 PM

Chatgpt 4当前可用并广泛使用,与诸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和产生连贯的响应方面取得了重大改进。未来的发展可能包括更多个性化的间

Google的Gencast:Gencast Mini Demo的天气预报 Google的Gencast:Gencast Mini Demo的天气预报 Mar 16, 2025 pm 01:46 PM

Google DeepMind的Gencast:天气预报的革命性AI 天气预报经历了巨大的转变,从基本观察到复杂的AI驱动预测。 Google DeepMind的Gencast,开创性

哪个AI比Chatgpt更好? 哪个AI比Chatgpt更好? Mar 18, 2025 pm 06:05 PM

本文讨论了AI模型超过Chatgpt,例如Lamda,Llama和Grok,突出了它们在准确性,理解和行业影响方面的优势。(159个字符)

O1 vs GPT-4O:OpenAI的新型号比GPT-4O好吗? O1 vs GPT-4O:OpenAI的新型号比GPT-4O好吗? Mar 16, 2025 am 11:47 AM

Openai的O1:为期12天的礼物狂欢始于他们迄今为止最强大的模型 12月的到来带来了全球放缓,世界某些地区的雪花放缓,但Openai才刚刚开始。 山姆·奥特曼(Sam Altman)和他的团队正在推出12天的礼物前

如何将Mistral OCR用于下一个抹布模型 如何将Mistral OCR用于下一个抹布模型 Mar 21, 2025 am 11:11 AM

MISTRAL OCR:通过多模式文档理解彻底改变检索效果 检索增强的生成(RAG)系统具有明显高级的AI功能,从而可以访问大量的数据存储,以获得更明智的响应

See all articles