妙鸭相机开源平替——连九块九都不要的个人形象定制

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
无影云电脑企业版,8核16GB 120小时 1个月
轻量应用服务器 2vCPU 1GiB,适用于搭建电商独立站
简介: FaceChain——妙鸭相机的开源平替,可以用来打造个人数字形象的深度学习模型工具,仅需三张照片即可生成属于你自己独有的个人数字形象替身,赶紧来计算巢体验吧!

前言

都3202年了,再不拥有一套属于自己的个人数字形象就真的赶不上时代了❗️❗️❗️❗️

如果你还不知道如何生成自己的个人数字形象,请让我来为你介绍:

FaceChain——妙鸭相机的开源平替,可以用来打造个人数字形象的深度学习模型工具,仅需三张照片(划重点,仅需三张!!)即可生成属于你自己独有的个人数字形象替身,赶紧来计算巢体验吧!

服务创建

首先在计算巢控制台找到FaceChain社区版,点击正式创建,或直接点击这里

1.png

第二步选择资源部署的地域和实例规格,填写实例密码。

⚠️注意,如果遇到实例规格列表为空的情况,可能是当前地域的库存不足,请切换其他地域重试!

2.png

第三步,填写软件登陆名和密码。⚠️一定要记住自己的密码,否则后面无法登陆软件⚠️

3.png

第四步,配置可用区和专有网络。

4.png

第五步,点击“下一步:确认订单”跳转,勾选“我已阅读并同意《计算巢服务协议》”,点击立即创建。

5.png

提交成功后点击去列表查看即可看到部署进度。

6.png

等待状态变为“已部署”后,点击详情跳转到服务实例详情页。

7.png

8.png

第六步,点击Endpoint,输入刚刚设置的用户名和密码即可登陆FaceChain界面开始创作啦!

9.png

形象定制

上传照片

第一步:点击选择图片上传,请务必一次性选择多张图片同时上传,且为了保证质量,选择清晰的头肩照为宜。

image.png

开始训练

第二步:在上面图片全部加载出来后,点击“开始训练”,然后就耐心等待吧~~~

这里由于后台会有下载模型和训练的过程,所以等待时间跟您的机器规格和所在地域有关,实测可能需要15-30分钟。但下载过一次之后下次再训练时就不需要下载了,只用等待几分钟就可以了!!!

11.png

直到输出信号出现“训练已经完成!”,这时候就可以愉快地进行下一步啦!!!12.png

形象定制

第三步:生成形象!切换到“形象体验”tab,输入不大于6的生成图片数量(形象虽好,可不要贪多哦),点击“开始推理”,就可以开始期待自己的个人数字形象啦!image.png

14.png

等待生成完毕后,即可获取自己的数字形象啦!

15.png

实现原理

AI 生成个人写真的能力来源于 Stable Diffusion 模型的文生图功能,即输入一段文本或一系列提示词,输出对应的图像。而影响个人写真生成效果的因素主要有两方面:写真风格信息和用户人物信息。

16.png

FaceChain分别使用线下训练的风格 LoRA 模型和线上训练的人脸 LoRA 模型来学习上述两方面的信息。LoRA 是一种具有较少可训练参数的微调模型,在 Stable Diffusion 中,可以通过对少量输入图像进行文生图训练的方式将输入图像的信息注入到 LoRA 模型中。因此,个人写真模型的能力分为训练与推理两个阶段,训练阶段生成用于微调 Stable Diffusion 模型的图像与文本标签数据,得到人脸 LoRA 模型;推理阶段基于人脸 LoRA 模型和风格 LoRA 模型生成个人写真图像。

训练阶段

训练阶段的输入是用户上传的包含清晰人脸区域的图像,输出是人脸 LoRA 模型。

具体来说,首先使用基于朝向判断的图像旋转模型,以及基于人脸检测和关键点模型的人脸精细化旋转方法,来处理用户上传图像,得到包含正向人脸的图像;接下来使用人体解析模型和人像美肤模型,以获得高质量的人脸训练图像;随后,该项目使用人脸属性模型和文本标注模型,结合标签后处理方法,产生训练图像的精细化标签;最后使用上述图像和标签数据微调 Stable Diffusion 模型得到人脸 LoRA 模型。

推理阶段

推理阶段的输入是训练阶段用户上传图像和预设的用于生成个人写真的输入 prompt,输出是个人写真图像。

在推理阶段,该项目首先将人脸 LoRA 模型和风格 LoRA 模型的权重融合到 Stable Diffusion 模型中;接下来使用 Stable Diffusion 模型的文生图功能,基于预设的 prompt 初步生成个人写真图像;随后,该项目使用人脸融合模型进一步改善上述写真图像的人脸细节,其中用于融合的模板人脸通过人脸质量评估模型在训练图像中进行挑选;最后再使用人脸识别模型计算生成的写真图像与模板人脸的相似度,以此对写真图像进行排序,并输出排名靠前的个人写真图像作为最终输出结果。

总结

简单几步,即可在计算巢中生成一套属于自己的数字形象,如此简单、便捷的方案,快来计算巢一探究竟吧!

参考

FaceChain项目:https://github.com/modelscope/facechain

机器之心报道:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650887719&idx=5&sn=040aeffa5c3b6ae1e5862912170e8a15

相关文章
|
机器学习/深度学习 搜索推荐 算法
推荐系统的算法与实现:深入解析与实践
【6月更文挑战第14天】本文深入探讨了推荐系统的原理与实现,包括用户和项目建模、协同过滤、内容过滤及混合推荐算法。通过收集用户行为数据,系统预测用户兴趣,提供个性化推荐。实践中,涉及数据处理、建模、算法选择及结果优化。随着技术发展,推荐系统将持续改进,提升性能和用户体验。
|
缓存 资源调度 JavaScript
nodejs全局(npm、cnpm、yarn)及缓存基本配置,一篇就搞定
nodejs全局(npm、cnpm、yarn)及缓存基本配置,一篇就搞定
|
6月前
|
程序员 开发者
PDF 转图片,一行代码搞定!批量支持已上线!
大家好,我是程序员晚枫!今天为大家介绍 `popdf` 的新功能:PDF 转图片,支持批量操作!只需一行代码即可完成单文件转换,批量处理也只需简单修改参数。工具简单易用,小白也能快速上手。`popdf` 是我开发的实用工具之一,旨在解决开发中的小痛点。欢迎访问 GitHub 项目地址 (<https://github.com/CoderWanFeng/popdf>),提出建议或加入开源小组,一起交流进步!快来体验吧,保证让你惊艳! 😄
187 16
|
7月前
|
人工智能 搜索推荐
基于 PAI-ArtLab 使用 ComfyUI 生成人像写真
本实验基于SDXL、InstantID技术,解决AI人像摄影中人物面部特征在风格迁移与图像放大后无法高度还原的问题。内置6种儿童风格提示词模板及提示词翻译模块,支持中文书写相关图像提示词测试个性化风格。需登录阿里云PAI ArtLab平台操作,领取免费试用资源后,通过ComfyUI(专享版)拉起服务并加载工作流,上传图片、选择草图、更换连线等步骤生成不同风格成果。还提供自定义风格模块和常见问题解答,方便用户解锁更多玩法。
|
11月前
|
机器学习/深度学习 编解码 算法
了解与对比主流背景去除工具
本文对比了几款主流的背景去除工具,包括Remove.bg、Removal.ai、RMBG 2.0、Imagga和Wondershare Pixcut,重点介绍了RMBG 2.0这款开源工具的性能、优势及挑战,适用于不同需求的用户选择。
|
11月前
|
机器学习/深度学习 数据采集 算法
Python机器学习:Scikit-learn库的高效使用技巧
【10月更文挑战第28天】Scikit-learn 是 Python 中最受欢迎的机器学习库之一,以其简洁的 API、丰富的算法和良好的文档支持而受到开发者喜爱。本文介绍了 Scikit-learn 的高效使用技巧,包括数据预处理(如使用 Pipeline 和 ColumnTransformer)、模型选择与评估(如交叉验证和 GridSearchCV)以及模型持久化(如使用 joblib)。通过这些技巧,你可以在机器学习项目中事半功倍。
246 3
|
机器学习/深度学习 人工智能 算法
解密巴黎奥运会中的阿里云AI技术
2024年巴黎奥运会圆满结束,中国代表团金牌数与美国并列第一,展现了卓越实力。阿里云作为官方云服务合作伙伴,通过先进的AI技术深度融入奥运的各项环节,实现了大规模的云上转播,超越传统卫星转播,为全球观众提供流畅、高清的观赛体验。其中,“子弹时间”回放技术在多个场馆的应用,让观众享受到了电影般的多角度精彩瞬间。此外,8K超高清直播、AI智能解说和通义APP等创新,极大地提升了赛事观赏性和互动性。能耗宝(Energy Expert)的部署则助力实现了赛事的可持续发展目标。巴黎奥运会的成功举办标志着体育赛事正式进入AI时代,开启了体育与科技融合的新篇章。
解密巴黎奥运会中的阿里云AI技术
|
安全 物联网 开发工具
《哇塞!flux.1 loras 竟如此神奇?十个问题带你揭开它的神秘面纱,开启震撼科技之旅!》
【8月更文挑战第20天】flux.1 LoraS 是一种基于LoRa的远距离、低功耗无线通信技术,适用于物联网领域。它利用扩频技术提升抗干扰性和传输距离,可在智能农业、物流等多种场景中部署。具备远距离传输、低能耗、高可靠性的特点,并支持AES-128加密确保安全通信。开发者可通过特定硬件和软件工具进行开发。随着物联网技术的发展,flux.1 LoraS 展现出广阔的应用前景。
276 2
|
测试技术
千问文本分类任务微调
这段代码定义了一个`predict`函数,它使用Hugging Face的`AutoModelForCausalLM`和`AutoTokenizer`来生成对话回复。模型和tokenizer分别从指定路径加载,然后对输入的`messages`(包含指令和用户输入)进行处理,通过模型生成响应。代码最后展示了一个测试用例,其中讨论了历史人物的评价。模型的输出被打印出来。整个流程涉及预处理、模型推理和后处理,用于生成与历史相关的内容。
410 6
|
缓存 Java
java: 警告: 源发行版 17 需要目标发行版 17,java17 无效的目标发行
java: 警告: 源发行版 17 需要目标发行版 17,java17 无效的目标发行
9975 3