妙鸭相机开源平替——连九块九都不要的个人形象定制

本文涉及的产品
资源编排,不限时长
无影云电脑企业版,4核8GB 120小时 1个月
无影云电脑个人版,黄金款:40核时/1个月有效
简介: FaceChain——妙鸭相机的开源平替,可以用来打造个人数字形象的深度学习模型工具,仅需三张照片即可生成属于你自己独有的个人数字形象替身,赶紧来计算巢体验吧!

前言

都3202年了,再不拥有一套属于自己的个人数字形象就真的赶不上时代了❗️❗️❗️❗️

如果你还不知道如何生成自己的个人数字形象,请让我来为你介绍:

FaceChain——妙鸭相机的开源平替,可以用来打造个人数字形象的深度学习模型工具,仅需三张照片(划重点,仅需三张!!)即可生成属于你自己独有的个人数字形象替身,赶紧来计算巢体验吧!

服务创建

首先在计算巢控制台找到FaceChain社区版,点击正式创建,或直接点击这里

1.png

第二步选择资源部署的地域和实例规格,填写实例密码。

⚠️注意,如果遇到实例规格列表为空的情况,可能是当前地域的库存不足,请切换其他地域重试!

2.png

第三步,填写软件登陆名和密码。⚠️一定要记住自己的密码,否则后面无法登陆软件⚠️

3.png

第四步,配置可用区和专有网络。

4.png

第五步,点击“下一步:确认订单”跳转,勾选“我已阅读并同意《计算巢服务协议》”,点击立即创建。

5.png

提交成功后点击去列表查看即可看到部署进度。

6.png

等待状态变为“已部署”后,点击详情跳转到服务实例详情页。

7.png

8.png

第六步,点击Endpoint,输入刚刚设置的用户名和密码即可登陆FaceChain界面开始创作啦!

9.png

形象定制

上传照片

第一步:点击选择图片上传,请务必一次性选择多张图片同时上传,且为了保证质量,选择清晰的头肩照为宜。

image.png

开始训练

第二步:在上面图片全部加载出来后,点击“开始训练”,然后就耐心等待吧~~~

这里由于后台会有下载模型和训练的过程,所以等待时间跟您的机器规格和所在地域有关,实测可能需要15-30分钟。但下载过一次之后下次再训练时就不需要下载了,只用等待几分钟就可以了!!!

11.png

直到输出信号出现“训练已经完成!”,这时候就可以愉快地进行下一步啦!!!12.png

形象定制

第三步:生成形象!切换到“形象体验”tab,输入不大于6的生成图片数量(形象虽好,可不要贪多哦),点击“开始推理”,就可以开始期待自己的个人数字形象啦!image.png

14.png

等待生成完毕后,即可获取自己的数字形象啦!

15.png

实现原理

AI 生成个人写真的能力来源于 Stable Diffusion 模型的文生图功能,即输入一段文本或一系列提示词,输出对应的图像。而影响个人写真生成效果的因素主要有两方面:写真风格信息和用户人物信息。

16.png

FaceChain分别使用线下训练的风格 LoRA 模型和线上训练的人脸 LoRA 模型来学习上述两方面的信息。LoRA 是一种具有较少可训练参数的微调模型,在 Stable Diffusion 中,可以通过对少量输入图像进行文生图训练的方式将输入图像的信息注入到 LoRA 模型中。因此,个人写真模型的能力分为训练与推理两个阶段,训练阶段生成用于微调 Stable Diffusion 模型的图像与文本标签数据,得到人脸 LoRA 模型;推理阶段基于人脸 LoRA 模型和风格 LoRA 模型生成个人写真图像。

训练阶段

训练阶段的输入是用户上传的包含清晰人脸区域的图像,输出是人脸 LoRA 模型。

具体来说,首先使用基于朝向判断的图像旋转模型,以及基于人脸检测和关键点模型的人脸精细化旋转方法,来处理用户上传图像,得到包含正向人脸的图像;接下来使用人体解析模型和人像美肤模型,以获得高质量的人脸训练图像;随后,该项目使用人脸属性模型和文本标注模型,结合标签后处理方法,产生训练图像的精细化标签;最后使用上述图像和标签数据微调 Stable Diffusion 模型得到人脸 LoRA 模型。

推理阶段

推理阶段的输入是训练阶段用户上传图像和预设的用于生成个人写真的输入 prompt,输出是个人写真图像。

在推理阶段,该项目首先将人脸 LoRA 模型和风格 LoRA 模型的权重融合到 Stable Diffusion 模型中;接下来使用 Stable Diffusion 模型的文生图功能,基于预设的 prompt 初步生成个人写真图像;随后,该项目使用人脸融合模型进一步改善上述写真图像的人脸细节,其中用于融合的模板人脸通过人脸质量评估模型在训练图像中进行挑选;最后再使用人脸识别模型计算生成的写真图像与模板人脸的相似度,以此对写真图像进行排序,并输出排名靠前的个人写真图像作为最终输出结果。

总结

简单几步,即可在计算巢中生成一套属于自己的数字形象,如此简单、便捷的方案,快来计算巢一探究竟吧!

参考

FaceChain项目:https://github.com/modelscope/facechain

机器之心报道:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650887719&idx=5&sn=040aeffa5c3b6ae1e5862912170e8a15

相关实践学习
2048小游戏
基于计算巢&ECS云服务器快速部署,带您畅玩2048小游戏。
相关文章
|
2月前
|
人工智能 开发者
黑神话:悟空中的AI行为树设计
【8月更文第26天】在《黑神话:悟空》这款游戏中,NPC(非玩家角色)的智能行为对于创造一个富有沉浸感的游戏世界至关重要。为了实现复杂的敌人行为模式,游戏开发团队采用了行为树作为NPC决策的核心架构。本文将详细介绍《黑神话:悟空》中NPC AI的设计原理,特别关注行为树的设计与实现。
81 0
|
2月前
黑神话:悟空中的音效设计与音乐制作
【8月更文第26天】在《黑神话:悟空》这款游戏中,音效和背景音乐是构建沉浸式游戏体验的重要组成部分。本文将探讨游戏音效和背景音乐的创作过程,以及它们如何增强游戏氛围。
150 0
|
定位技术 图形学
Unity3D——射击游戏(多地图,多人物,枪支切换,驾车,扔手雷等功能,堪比小型和平精英)
Unity3D——射击游戏(多地图,多人物,枪支切换,驾车,扔手雷等功能,堪比小型和平精英)
Unity3D——射击游戏(多地图,多人物,枪支切换,驾车,扔手雷等功能,堪比小型和平精英)
|
存储 物联网 开发工具
开源:纯手工基于小熊派&涂鸦三明治模组快速打造一款智能宠物喂食器连载贴(一)
开源:纯手工基于小熊派&涂鸦三明治模组快速打造一款智能宠物喂食器连载贴(一)
454 0
|
C++
你们想要的开源的冰墩墩模型来了!! 先睹为快!实现冰墩墩自由!
你们想要的开源的冰墩墩模型来了!! 先睹为快!实现冰墩墩自由!
145 0
|
传感器 开发框架 网络协议
羡慕《钢铁侠》电影里科技感满满的全息手势交互吗?现在你也可以!试试这款【本地手势识别案例】
羡慕《钢铁侠》电影里科技感满满的全息手势交互吗?现在你也可以!试试这款【本地手势识别案例】
180 0
|
JavaScript Java API
@Value竟然能玩出这么多花样
@Value竟然能玩出这么多花样
@Value竟然能玩出这么多花样
|
网络协议 算法 机器人
Halcon标定系列(3):我个人总结的“眼在手外“和“眼在手上”的心得笔记
Halcon标定系列(3):我个人总结的“眼在手外“和“眼在手上”的心得笔记
2816 0
Halcon标定系列(3):我个人总结的“眼在手外“和“眼在手上”的心得笔记
|
机器学习/深度学习 图形学 计算机视觉
一边动,一边画,自己就变二次元!华人小哥参与的黑科技:实时交互式视频风格化
云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 动画,动画,就是你动你的,我画我的。 就像下面这张GIF,左边是张静态图片,随着画者一点一点为其勾勒色彩,右边的动图也在实时地变换颜色。
一边动,一边画,自己就变二次元!华人小哥参与的黑科技:实时交互式视频风格化
下一篇
无影云桌面