酷蛙FaceChain开源项目迭代周记2023-08-19

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,5000CU*H 3个月
模型训练 PAI-DLC,5000CU*H 3个月
简介: 酷蛙FaceChain开源项目(https://github.com/modelscope/facechain)上线首周即获取超过3K Star,并登顶GitHub Trending榜单TOP 1。

本周数据概览

酷蛙FaceChain开源项目(https://github.com/modelscope/facechain)上线首周即获取超过3K Star,并登顶GitHub Trending榜单TOP 1。

image.png


本周上新功能

1、基础版本效果:商务形象照/证件照

image.png

image.png



2、高阶功能:个性化prompt

FaceChain本身基于框架化的设计,各个组件均具备插件化,定制化的能力。例如通过prompt自定义能力,即可允许用户进行DIY。例如这里,我们在基础形象照风格模型不变的情况下,尝试了如下几种自定义的prompt,效果如下:


1)汉服

image.png


image.png



2)晚礼服

image.png

image.png



3)个性化:如指环王风格

自定义输入:The lord of the rings, ELF, Arwen Undomiel, beautiful, upper_body, best quality, Professional

 

image.png



3、高阶功能:风格化LoRA融合

FaceChain框架里的风格LoRA模型,同样是支持定制化的,这使得不同的风格化LoRA模型,都可以在FaceChain上实现一键体验。例如《凤冠霞帔》模型(该风格lora模型出自:https://www.liblibai.com/modelinfo/f746450340a3a932c99be55c1a82d20c),在接入FaceChain做简单的打通,替换原有的基础证件照风格模型之后,效果如下:


image.png


大家如果有实现出效果较为满意或者惊艳风格的,也欢迎commit到FaceChain这个项目上来,成为该项目贡献的一员。


4、还有一些工程化的改进


1)在魔搭notebook上已经支持50G磁盘+24G显存的免费体验环境

打开这个地址:https://modelscope.cn/my/mynotebook,按照以下4步就可以成功运行自己的Gradio

# Step1: 我的notebook -> PAI-DSW -> GPU环境
# Step2: Open the Terminal,clone FaceChain from github:
GIT_LFS_SKIP_SMUDGE=1 git clone https://github.com/modelscope/facechain.git --depth 1
# Step3: Entry the Notebook cell:
import os
os.chdir('/mnt/workspace/facechain')
print(os.getcwd())
!pip3 install gradio
!python3 app.py
# Step4: click "public URL" or "local URL", upload your images to 
# train your own model and then generate your digital twin.


2)Gradio体验页面布局优化,并同时支持中、英双语

3)支持在colab上运行

4)代码进行重构,整体更加简洁

5)  透出完整prompt和部分超参数

6)  完善README介绍

7)  支持脚本化运行训练和推理


全球开发者招募


我们希望联合开源社区的力量持续、高效地打磨该开源项目,解锁更多高阶玩法(比如人物表情包、人物连环画故事、虚拟试衣间……),并进行更深层次的算法创新,发表相应顶会论文。

image.png


如果你对该开源项目感兴趣,对该开源项目的未来有憧憬与信仰,欢迎报名加入:https://www.yuque.com/forms/share/5892d145-99c3-406c-8785-13dcb50353b8



附录


1、原理讲解图文

3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!


2、图文没看过瘾,那就来看看项目组的直播详解吧

https://developer.aliyun.com/live/252626?spm=a2c6h.26396819.creator-center.8.75e93e18htMEyA


3、纯享直播完整版~

https://developer.aliyun.com/live/252626?spm=a2c6h.26396819.creator-center.8.75e93e18htMEyA


4、Github地址

https://github.com/modelscope/facechain


5、魔搭创空间应用地址(无门槛人人都可玩起来)

https://modelscope.cn/studios/CVstudio/cv_human_portrait/summary


最后,记得点击阅读原文报名加入项目组~

https://www.yuque.com/forms/share/5892d145-99c3-406c-8785-13dcb50353b8

相关文章
|
4月前
|
数据采集 自然语言处理 前端开发
社区供稿 | 猎户星空百亿参数大模型 Orion-14B系列开源,一张3060就能跑(附魔搭社区推理微调最佳实践)
1月21日,傅盛在猎户星空大模型发布会上宣布,“为企业应用而生” 的开源百亿参数猎户星空大模型正式发布。猎户星空大模型(Orion-14B)是由猎户星空研发的预训练多语言大语言模型,以其140亿参数规模展现出了卓越的性能。
|
编解码 人工智能 物联网
离FaceChain应用生态爆发还有多远?-0905迭代周记
在过去的不到一个月,FaceChain开源项目从无到有,成功突破了相关技术瓶颈,GitHub(https://github.com/modelscope/facechain)获得了超过4.6K star,为未来的应用发展奠定了坚实的基础。
离FaceChain应用生态爆发还有多远?-0905迭代周记
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
社区供稿 | 元象发布255B大规模MoE开源大模型,落地应用登顶港台榜
元象XVERSE发布 中国最大MoE开源模型:XVERSE-MoE-A36B,加速AI应用低成本部署,将国产开源提升至国际领先水平。
社区供稿 | 元象发布255B大规模MoE开源大模型,落地应用登顶港台榜
|
4天前
|
人工智能 运维 IDE
CodeFuse 开源一周年,焕新出发!
CodeFuse 是蚂蚁集团推出的开源项目,旨在通过大型代码语言模型(Code LLMs)支持软件开发生命周期各阶段,包括设计、编码、测试、部署等。自2023年9月开源以来,CodeFuse 不断迭代,推出了一系列创新产品和技术,如 CodeFuse IDE、muAgent 2.0 框架及 CGE 和 Rodimus 模型。项目已在蚂蚁集团内部广泛应用,并在多个行业会议上展示分享。未来,CodeFuse 将继续深耕开源,推出更多创新产品,并加强社区互动与合作。欢迎访问 CodeFuse 官网和 GitHub 项目主页了解更多详情。
23 0
CodeFuse 开源一周年,焕新出发!
|
4月前
|
机器学习/深度学习 人工智能 安全
算子开发到推理加速,一位00后开发者的“升级打怪”之旅
郑辉,从大四学生到资深AI开发者,他的成长轨迹映射了中国AI生态的繁荣。他独立开发的NonZero算子被纳入CANN主线,参与的深度学习框架降低了大模型训练门槛。在昇腾AI生态中,郑辉们正助力大模型发展。从初次接触分布式机器学习到优化算子,再到参与大模型推理加速项目,郑辉在实践中不断成长,他的工作有望帮助开发者更高效地部署在线推理服务。他的故事展示了开发者如何通过团队合作和持续学习,克服挑战,推动AI在各行业的应用,照亮智能化之路。
|
4月前
|
机器学习/深度学习 人工智能 算法
仅靠开源数据复刻出LLaMA3指令学习效果,在线迭代RLHF全流程解决方案来了
【5月更文挑战第27天】在线迭代RLHF方案使用开源数据复现LLaMA3指令学习效果,提供了一种动态收集和更新模型的新方法,提升大型语言模型的性能。通过代理偏好模型模拟人类反馈,降低训练成本,促进技术民主化。虽然面临数据利用、探索与利用平衡等挑战,且需解决长尾分布数据处理问题,该方案已在多基准测试中展现优秀性能,为LLM训练提供高效途径。论文链接:https://arxiv.org/pdf/2405.07863
45 1
|
4月前
|
人工智能 Rust Apache
社区供稿 | 更长、更强、更开放,零一万物 Yi-1.5 系列开源模型发布一周广受好评
5 月 13 日,零一万物 Yi 系列开源模型全新升级为 Yi-1.5。相较于去年 11 月的开源版本,这次的 Yi-1.5 在保持原 Yi 系列模型优秀的通用语言能力的前提下,通过增量训练 500B 高质量 token,大幅提高了数学逻辑、代码能力。
|
机器学习/深度学习 存储 编解码
一劳永逸—MIT韩松团队开源神经网络的高效部署
一劳永逸—MIT韩松团队开源神经网络的高效部署
307 0
|
机器学习/深度学习 人工智能 自然语言处理
田渊栋团队发布「长故事生成器」第二版DOC:连贯性大幅提升,趣味性提升20.7%!
田渊栋团队发布「长故事生成器」第二版DOC:连贯性大幅提升,趣味性提升20.7%!
250 0
|
机器学习/深度学习 算法 数据挖掘
浙大发布「数据混合增强」框架AutoMix,还顺手开源了众多mixup算法(1)
浙大发布「数据混合增强」框架AutoMix,还顺手开源了众多mixup算法
179 0