使用 PAI X EasyPhoto 生成 AI 写真

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: AIGC生成专属双旦美图,节日氛围拉满基于 EasyPhoto X 人工智能平台 PAI,完成圣诞/新年主题个人AIGC写真生成。

1. 教程简述

生成式AI技术批量产出真/像/美的个人写真应用非常受欢迎。近期上线的EasyPhoto 作为一款开源的 SD WebUI 插件,提供更灵活、易用的开发方式,受到大量开发者们的关注和好评,用户可通过上传若干张同一人的照片,即可快速训练 LoRA 模型,并结合用户自定义的模板图片,最终生成真、像、美的写真照片。

EasyPhoto 是一个Webui UI插件,用于生成AI肖像画。基于StableDiffusion + 人物定制Lora + ControlNet 的方式实现,支持低代码操作、自定义风格,内置丰富模版,让更多开发者可以灵活地开发自己的风格化的艺术照生成。 本次AIGC创作活动基于阿里云人工智能平台PAI,低代码高效率启动EasyPhoto,实现节日氛围美图的快速生成。


基于本教程可以体验:

新用户可免费领取价值万元的人工智能平台PAI 试用资源

基于交互式建模PAI-DSW 训练个人专属的 LoRA 模型

节日AI写真新创作,体验生成圣诞/新年等节日氛围感满满的个性化 AI 写真


2. 使用PAI 快速启动 EasyPhoto

2.1 准备工作

2.1.1 领取交互式建模PAI-DSW免费试用权益

image.png

  • 对于交互式建模 PAI-DSW 的新用户,阿里云提供了5000CU*H 的免费试用资源,可以在活动页面中直接领取(试用规则请参照阿里云免费试用);或可以购买交互式建模 PAI-DSW 资源包参与活动,购买链接:PAI-DSW 100CU*H资源包,价格 59 元起;如不购买资源包,PAI-DSW 会按量进行计费,计费标准详见阿里云产品定价。

2.1.2 创建PAI-DSW实例

  1. 前往人工智能平台PAI控制台
  2. 开通人工智能PAI并创建默认工作空间。请参见开通并创建默认工作空间
  3. 在人工智能平台PAI控制台内,选择交互式建模PAI-DSW

image.png

  1. 点击创建实例(如上图)
  2. 自定义输入实例名称,如“easyphoto”

966DA134-9F18-41c3-94F9-AE940A7BF069.png

  1. 选择实例机型,GPU分类-ecs.gn6v-c8g1.2xlarge(支持资源包抵扣)或GPU分类-ecs.gn7i-c8g1.2xlarge

(支持资源包抵扣)。若这两个机型库存可更换地域尝试,或选择其他付费机型(不支持免费试用)。

966DA134-9F18-41c3-94F9-AE940A7BF069.png

  1. 选择镜像,stable-diffusion-webui-develop:1.0.0-pytorch2.01-gpu-py310-cu117-ubuntu22.04

image.png

  1. 点击“下一步”

image.png

  1. 确认【资源配置】及【镜像】如图所示,点击创建实例;

image.png

  1. 大约等到3-5分钟,实例状态变为「运行中」,实例创建完成;

image.png

1.4 在PAI-DSW中打开EasyPhoto教程,体验零代码完成AI开发

  1. 打开链接:基于EasyPhoto的AI新年-圣诞写真大挑战 (WebUI版),点击右上角「在阿里云DSW打开」

image.png

  1. 选择先前创建好的实例,点击实例名称

image.png

  1. 进入notebook开发界面,逐步点击运行按钮;依次运行 1.环境安装 节的单元格(3个 定义函数-下载代码-下载模型),可下载并安装预置的带有EasyPhoto插件的WebUI,即所依赖的模型。

image.png

  1. 运行 2.启动WebUI 节的单元格,可打开WebUI。
  2. 单击生成的链接进入WebUI

image.png

  • 打开WebUI,进入体验环节,在WebUI里运行EasyPhoto;

2. 开始体验

您可以使用本教程生成自己的节日写真/动图,我们提供了如下的功能:

  • 人物写真(Photo Inference)
  • 指定图片的人物写真 (Photo2Photo)
  • 指定文本的人物写真 (Text2Photo)
  • 人物动图(Video Inference)
  • 指定文本的人物动图 (Text2Video)
  • 指定图片的人物动图 (Image2Video)
  • 指定视频的人物动图 (Video2Video)

大体上,人物写真/动图的生成分为以下两个步骤:

  • Step1: 训练属于人物的数字分身
  • Step2: 基于数字分身进行图像/视频生成

生成图片请参考2.2板块,生成视频请参考2.3板块。

2.1 数字分身训练

  • Step1: 点击EasyPhoto选项卡
  • Step2: 点击Upload Photos 上传自己的训练图片 (5-20张清晰的人像,最好为半身/正面)

(若无10张个人清晰人像照片,可选择蒙娜丽莎照片作为测试,蒙娜丽莎照片下载链接:https://pai-aigc-photog.oss-cn-hangzhou.aliyuncs.com/webui/mona.zip

  • Step3: 点击Start Training (在弹框中输入任意的user id (英文))

image.png

我们为您内置了写实/动漫风格的两种基模型供您选择,您也可以根据喜好选择自己的基模型。

image.png

请注意,如在训练过程中出现如图所示的前端断连,不用担心,您可在notebook后台看见训练进度。待训练完成后刷新前端页面可以进行模型推理。

  • 前端断连(连接超时 确保后台在训练即可):

image.png

  • 训练完成提醒:
  • SDWebUI 前端

image.png

  • notebook后端

image.png

2.2 图像推理 (Photo Inference)

您可使用Photo Inference 进行图像推理,我们支持:

  • 指定图像的人物写真(Photo2Photo)
  • 指定文本的人物写真(Text2Photo)

2.2.1 指定图像的人物写真

  • Step 1: 切到Photo inference选项卡
  • Step 2: 选择一种合适的图片上传方式
  • 从模版中选择(Template Gallery),需在Gallery中选择一张图片
  • 自行上传单张(Single Image Upload)
  • 批量上传模版(Batch Image Upload)

image.png

  • Step 3: 选择基模型和UserId对应的LoRA模型 (可点击 刷新 图标 获得所有的UserID列表)

image.png

  • 使用Infer With IPA时 无需训练自己的数字分身,直接在弹出的图片框中上传一张图进行生成。

image.png

  • Step 4: 可在Advanced Option选项卡中设置相关的参数
  • 可打开background restore,并调整重绘幅度,对模版图片进行重绘来达到不同的生成效果。

image.png

  • Step 5: 点击Start Generation 进行模型推理,生成专属于您的AI写真
  • 稍等约1-2分钟后,图片生成完成,可下载存储图片;

image.png

  • Step6: 您可进一步选择生成图片,单击Text Options,选择一个合适的模版添加艺术字效果,生成的结果将出现在Results 的右侧。

image.png

  • 将图片提交至活动页,参与评奖活动;

⚠️ 若出现如下提示,请设置ControlNet 数目>=4。在控制台退出并重启WebUI进行设置。

  • Step1: 选择 设置 菜单
  • Step2: 在左侧菜单栏中找到ControlNet
  • Step3: 将Multi-ControlNet数目设置>=4
  • Step4: 点击保存设置
  • Step5: 回到notebook页面,停止并重新启动SDWebUI

image.png

image.png

2.2.2 指定文本的人物写真

  • Step 1: 切到Text2Photo选项卡
  • Step 2: 选择一种合适的场景
  • Step 3: 修改相关的文本描述

image.png

  • Step4: 设置生成图像分辨率
  • Step5: 进一步选择/上传 控制图像(姿态控制 OpenPose)

image.png

  • Step6: 与图生图一致的设置 基模型/User_id 及其他参数,进行图像生成,并在生成完成后自行添加艺术字效果。

image.png

* 您可以参考这里的使用方式来进一步训练自己的节日场景,多样化的生成人像写真~

2.3 视频推理 (Video Inference)

您可使用Video Inference 进行视频推理,我们支持:

  • 指定文本的人物动图(Text2Video)
  • 指定图像的人物动图(Image2Video)
  • 指定视频的人物动图(Video2Video)

2.3.1 指定文本的人物动图

  • Step 1: 切到Video inference选项卡
  • Step 2: 选择一个合适的场景,并修改相应的prompy(与 指定文本的人物写真 操作相同)
  • Step 3: 设置图像大小,或上传一个用于控制的视频,并选择合适的控制方式。

image.png

  • Step 4: 设置基模型、user_id 以及相关的参数。

⚠️ 我们默认打开了lcm 用于视频生成的加速,您可关闭该选项用更多的生成步数来生成更细节的视频结果。

image.png

  • Step 5: 点击 Start Generation 来生成视频
  • 如前端错误,后台显示生成完成,您可单击 List Recent Conversion Results 来下载/查看 生成的历史视频。(无需刷新)

image.png

  • Step 6: 点击 Text Option 来对生成视频添加艺术字效果。您可以选择某一帧,或将艺术字效果应用于整段视频。

image.png

2.3.2 指定图像的人物动图

  • Step1: 上传一张 人物图 (可通过 💃 按钮 将生成的人物写真发送至此)/ 上传首、尾图

image.png

  • Step2: 设置基模型、user_id 及相关参数。点击Start Generation 可进行视频的生成。并使用Text Options进行艺术字的添加。

1C096FB1-EF17-453f-A4CF-DDC8A55B6DE8.png 1703090416603-f26a5494-acae-4e44-b924-260ebfcb3194.gif

2.3.3 指定视频的人物动图

  • Step1: 上传一段人物视频
  • Step2: 设置基模型、user_id 及相关参数。点击Start Generation 可进行视频的生成。并使用Text Options进行艺术字的添加。

3. 资源清理及后续

3.1 清理

  • 在实验完成后,可前往对应产品控制台,停止或删除实例(两个操作均可),避免实例持续处于运行中,在超出免费试用额度后,带来额外的扣费

image.png

  • 后续仍考虑使用该实例>>停止;后续不再使用该实例>>删除,成功停止后即停止资源消耗。

3.2 后续

在试用有效期期间,您还可以继续使用DSW实例进行模型训练和推理验证。

如需技术支持,请在钉钉搜索群号「 52485000325」,加入群聊。

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
16天前
|
人工智能 数据可视化 IDE
AI编程:cursor使用教程
这是小卷对AI编程工具学习的首篇文章,以Cursor为例,介绍其安装与基本功能。Cursor分为狭义和广义两类,前者辅助程序员高效编程,后者让无基础用户也能创建应用。文章详细讲解了Cursor的安装、快捷键、代码生成、修改、补全及项目理解等功能,并展示了如何通过提示词实现需求,帮助小白轻松上手编程。
379 76
|
1月前
|
人工智能 机器人 UED
不怕不会设计logo拉-本篇教你如何使用AI设计logo-如何快速用AI设计logo-附上AI绘图logo设计的咒语-优雅草央千澈-实战教程
不怕不会设计logo拉-本篇教你如何使用AI设计logo-如何快速用AI设计logo-附上AI绘图logo设计的咒语-优雅草央千澈-实战教程
147 86
不怕不会设计logo拉-本篇教你如何使用AI设计logo-如何快速用AI设计logo-附上AI绘图logo设计的咒语-优雅草央千澈-实战教程
|
1月前
|
存储 人工智能 大数据
AI开发新范式,PAI模型构建平台升级发布
本次分享由阿里云智能集团产品专家高慧玲主讲,聚焦AI开发新范式及PAI模型构建平台的升级。分享分为四个部分,围绕“人人可用”和“面向生产”两大核心理念展开。通过降低AI工程化门槛、提供一站式全链路服务,PAI平台致力于帮助企业和开发者更高效地实现AI应用。案例展示中,介绍了多模态模型微调在文旅场景的应用,展示了如何快速复现并利用AI解决实际问题。最终目标是让AI技术更普及,赋能各行业,推动社会进步。
|
6天前
|
人工智能 自然语言处理 安全
【2025】世界顶级AI模型本地部署私有化完整版教程 DeepSeek-R1+Ollama+ChatboxAI合体,瞬间升级你的个人电脑秒变智能神器!
震撼发布!让你的电脑智商飙升,DeepSeek-R1+Ollama+ChatboxAI合体教程,打造私人智能神器!
240 42
【2025】世界顶级AI模型本地部署私有化完整版教程 DeepSeek-R1+Ollama+ChatboxAI合体,瞬间升级你的个人电脑秒变智能神器!
|
7天前
|
人工智能 开发框架 机器人
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
AstrBot 是一个开源的多平台聊天机器人及开发框架,支持多种大语言模型和消息平台,具备多轮对话、语音转文字等功能。
2015 13
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
|
7天前
|
人工智能 资源调度 API
AnythingLLM:34K Star!一键上传文件轻松打造个人知识库,构建只属于你的AI助手,附详细部署教程
AnythingLLM 是一个全栈应用程序,能够将文档、资源转换为上下文,支持多种大语言模型和向量数据库,提供智能聊天功能。
2238 13
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
Java+机器学习基础:打造AI学习基础
随着人工智能(AI)技术的飞速发展,越来越多的开发者开始探索如何将AI技术应用到实际业务场景中。Java作为一种强大的编程语言,不仅在企业级应用开发中占据重要地位,在AI领域也展现出了巨大的潜力。本文将通过模拟一个AI应用,从背景历史、业务场景、优缺点、底层原理等方面,介绍如何使用Java结合机器学习技术来打造一个AI学习的基础Demo。
40 18
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
国产AI神器Deepseek,本地离线使用教程!
国产AI神器Deepseek,本地离线使用教程!
50 14
|
6天前
|
人工智能 关系型数据库 分布式数据库
PolarDB 开源基础教程系列 7.4 应用实践之 AI大模型外脑
PolarDB向量数据库插件通过实现通义大模型AI的外脑,解决了通用大模型无法触达私有知识库和产生幻觉的问题。该插件允许用户将新发现的知识和未训练的私有知识分段并转换为向量,存储在向量数据库中,并创建索引以加速相似搜索。当用户提问时,系统将问题向量化并与数据库中的向量进行匹配,找到最相似的内容发送给大模型,从而提高回答的准确性和相关性。此外,PolarDB支持多种编程语言接口,如Python,使数据库具备内置AI能力,极大提升了数据处理和分析的效率。
29 4
|
1月前
|
人工智能 API UED
AI智能体再进化,工作流怎么玩?阿里云百炼上手教程
本次分享由讲师林粒粒呀介绍如何快速制作AI智能工具,特别是利用阿里云百炼平台创建工作流。通过简单的拖拽操作,小白用户也能轻松上手,实现从PPT主题到大纲的自动生成,并能一次性生成多个版本。借助API和Python脚本,还可以将Markdown格式的大纲转换为本地PPT文件。整个流程展示了AI智能体在实际应用中的高效性和实用性,帮助用户大幅提升工作效率。
190 32

相关产品

  • 人工智能平台 PAI