妙鸭相机开源平替——连九块九都不要的个人形象定制

本文涉及的产品
无影云电脑企业版,4核8GB 120小时 1个月
无影云电脑个人版,1个月黄金款+200核时
资源编排,不限时长
简介: FaceChain——妙鸭相机的开源平替,可以用来打造个人数字形象的深度学习模型工具,仅需三张照片即可生成属于你自己独有的个人数字形象替身,赶紧来计算巢体验吧!

前言

都3202年了,再不拥有一套属于自己的个人数字形象就真的赶不上时代了❗️❗️❗️❗️

如果你还不知道如何生成自己的个人数字形象,请让我来为你介绍:

FaceChain——妙鸭相机的开源平替,可以用来打造个人数字形象的深度学习模型工具,仅需三张照片(划重点,仅需三张!!)即可生成属于你自己独有的个人数字形象替身,赶紧来计算巢体验吧!

服务创建

首先在计算巢控制台找到FaceChain社区版,点击正式创建,或直接点击这里

1.png

第二步选择资源部署的地域和实例规格,填写实例密码。

⚠️注意,如果遇到实例规格列表为空的情况,可能是当前地域的库存不足,请切换其他地域重试!

2.png

第三步,填写软件登陆名和密码。⚠️一定要记住自己的密码,否则后面无法登陆软件⚠️

3.png

第四步,配置可用区和专有网络。

4.png

第五步,点击“下一步:确认订单”跳转,勾选“我已阅读并同意《计算巢服务协议》”,点击立即创建。

5.png

提交成功后点击去列表查看即可看到部署进度。

6.png

等待状态变为“已部署”后,点击详情跳转到服务实例详情页。

7.png

8.png

第六步,点击Endpoint,输入刚刚设置的用户名和密码即可登陆FaceChain界面开始创作啦!

9.png

形象定制

上传照片

第一步:点击选择图片上传,请务必一次性选择多张图片同时上传,且为了保证质量,选择清晰的头肩照为宜。

image.png

开始训练

第二步:在上面图片全部加载出来后,点击“开始训练”,然后就耐心等待吧~~~

这里由于后台会有下载模型和训练的过程,所以等待时间跟您的机器规格和所在地域有关,实测可能需要15-30分钟。但下载过一次之后下次再训练时就不需要下载了,只用等待几分钟就可以了!!!

11.png

直到输出信号出现“训练已经完成!”,这时候就可以愉快地进行下一步啦!!!12.png

形象定制

第三步:生成形象!切换到“形象体验”tab,输入不大于6的生成图片数量(形象虽好,可不要贪多哦),点击“开始推理”,就可以开始期待自己的个人数字形象啦!image.png

14.png

等待生成完毕后,即可获取自己的数字形象啦!

15.png

实现原理

AI 生成个人写真的能力来源于 Stable Diffusion 模型的文生图功能,即输入一段文本或一系列提示词,输出对应的图像。而影响个人写真生成效果的因素主要有两方面:写真风格信息和用户人物信息。

16.png

FaceChain分别使用线下训练的风格 LoRA 模型和线上训练的人脸 LoRA 模型来学习上述两方面的信息。LoRA 是一种具有较少可训练参数的微调模型,在 Stable Diffusion 中,可以通过对少量输入图像进行文生图训练的方式将输入图像的信息注入到 LoRA 模型中。因此,个人写真模型的能力分为训练与推理两个阶段,训练阶段生成用于微调 Stable Diffusion 模型的图像与文本标签数据,得到人脸 LoRA 模型;推理阶段基于人脸 LoRA 模型和风格 LoRA 模型生成个人写真图像。

训练阶段

训练阶段的输入是用户上传的包含清晰人脸区域的图像,输出是人脸 LoRA 模型。

具体来说,首先使用基于朝向判断的图像旋转模型,以及基于人脸检测和关键点模型的人脸精细化旋转方法,来处理用户上传图像,得到包含正向人脸的图像;接下来使用人体解析模型和人像美肤模型,以获得高质量的人脸训练图像;随后,该项目使用人脸属性模型和文本标注模型,结合标签后处理方法,产生训练图像的精细化标签;最后使用上述图像和标签数据微调 Stable Diffusion 模型得到人脸 LoRA 模型。

推理阶段

推理阶段的输入是训练阶段用户上传图像和预设的用于生成个人写真的输入 prompt,输出是个人写真图像。

在推理阶段,该项目首先将人脸 LoRA 模型和风格 LoRA 模型的权重融合到 Stable Diffusion 模型中;接下来使用 Stable Diffusion 模型的文生图功能,基于预设的 prompt 初步生成个人写真图像;随后,该项目使用人脸融合模型进一步改善上述写真图像的人脸细节,其中用于融合的模板人脸通过人脸质量评估模型在训练图像中进行挑选;最后再使用人脸识别模型计算生成的写真图像与模板人脸的相似度,以此对写真图像进行排序,并输出排名靠前的个人写真图像作为最终输出结果。

总结

简单几步,即可在计算巢中生成一套属于自己的数字形象,如此简单、便捷的方案,快来计算巢一探究竟吧!

参考

FaceChain项目:https://github.com/modelscope/facechain

机器之心报道:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650887719&idx=5&sn=040aeffa5c3b6ae1e5862912170e8a15

相关实践学习
2048小游戏
基于计算巢&ECS云服务器快速部署,带您畅玩2048小游戏。
相关文章
|
8月前
|
人工智能 黑灰产治理 开发者
虚拟模特,一键生成高颜值AI模特!活动震撼来袭,快来生成你的高颜值模特大片!
体验”通义万相-虚拟模特“,晒出属于你的高颜值AI模特大片,在活动页面提交作品以及使用反馈,即有机会获得反馈奖哦!
692 10
虚拟模特,一键生成高颜值AI模特!活动震撼来袭,快来生成你的高颜值模特大片!
|
存储 物联网 开发工具
开源:纯手工基于小熊派&涂鸦三明治模组快速打造一款智能宠物喂食器连载贴(一)
开源:纯手工基于小熊派&涂鸦三明治模组快速打造一款智能宠物喂食器连载贴(一)
472 0
|
人工智能 Cloud Native 算法
妙鸭相机x阿里云,AIGC与云计算的双向奔赴
妙鸭相机x阿里云,AIGC与云计算的双向奔赴
462 0
|
人工智能
风格强化、极致动漫美学,绘画神器Midjourney迎来二次元升级
风格强化、极致动漫美学,绘画神器Midjourney迎来二次元升级
316 0
|
机器学习/深度学习 人工智能 自然语言处理
加特技只需一句话or一张图,Stable Diffusion的公司把AIGC玩出了新花样
加特技只需一句话or一张图,Stable Diffusion的公司把AIGC玩出了新花样
166 0
|
传感器 开发框架 网络协议
羡慕《钢铁侠》电影里科技感满满的全息手势交互吗?现在你也可以!试试这款【本地手势识别案例】
羡慕《钢铁侠》电影里科技感满满的全息手势交互吗?现在你也可以!试试这款【本地手势识别案例】
197 0
|
算法 机器人 程序员
|
存储 vr&ar 开发工具
这款搭载了 16 个镜头的全景相机堪称开挂,可惜售价贵到没朋友
随着 VR 的火爆,不少公司开始推出各种全景相机相关的产品,上周英伟达才发布一款全景相机的 SDK,最多可让 32 个镜头拼在一起,不过这种需要 DIY 的设备对于技术宅来说比较适合,懒得折腾的伙伴还是乖乖用成品的设备好。
168 0
这款搭载了 16 个镜头的全景相机堪称开挂,可惜售价贵到没朋友
|
存储 人工智能 Kubernetes
95后宠爱的百变音乐神器,唱鸭玩转云原生AI
容器镜像服务企业版 ACR EE 不仅具备高效的镜像分发能力,而且也提供了安全的云原生应用交付链能力,唱鸭可以从容不迫地完成每天 10+ 次的容器化部署,DevSecOps 的体感非常顺滑。
2113 0
95后宠爱的百变音乐神器,唱鸭玩转云原生AI