酷蛙FaceChain开源项目迭代周记2023-08-19

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 酷蛙FaceChain开源项目(https://github.com/modelscope/facechain)上线首周即获取超过3K Star,并登顶GitHub Trending榜单TOP 1。

本周数据概览

酷蛙FaceChain开源项目(https://github.com/modelscope/facechain)上线首周即获取超过3K Star,并登顶GitHub Trending榜单TOP 1。

image.png


本周上新功能

1、基础版本效果:商务形象照/证件照

image.png

image.png



2、高阶功能:个性化prompt

FaceChain本身基于框架化的设计,各个组件均具备插件化,定制化的能力。例如通过prompt自定义能力,即可允许用户进行DIY。例如这里,我们在基础形象照风格模型不变的情况下,尝试了如下几种自定义的prompt,效果如下:


1)汉服

image.png


image.png



2)晚礼服

image.png

image.png



3)个性化:如指环王风格

自定义输入:The lord of the rings, ELF, Arwen Undomiel, beautiful, upper_body, best quality, Professional

 

image.png



3、高阶功能:风格化LoRA融合

FaceChain框架里的风格LoRA模型,同样是支持定制化的,这使得不同的风格化LoRA模型,都可以在FaceChain上实现一键体验。例如《凤冠霞帔》模型(该风格lora模型出自:https://www.liblibai.com/modelinfo/f746450340a3a932c99be55c1a82d20c),在接入FaceChain做简单的打通,替换原有的基础证件照风格模型之后,效果如下:


image.png


大家如果有实现出效果较为满意或者惊艳风格的,也欢迎commit到FaceChain这个项目上来,成为该项目贡献的一员。


4、还有一些工程化的改进


1)在魔搭notebook上已经支持50G磁盘+24G显存的免费体验环境

打开这个地址:https://modelscope.cn/my/mynotebook,按照以下4步就可以成功运行自己的Gradio

# Step1: 我的notebook -> PAI-DSW -> GPU环境
# Step2: Open the Terminal,clone FaceChain from github:
GIT_LFS_SKIP_SMUDGE=1 git clone https://github.com/modelscope/facechain.git --depth 1
# Step3: Entry the Notebook cell:
import os
os.chdir('/mnt/workspace/facechain')
print(os.getcwd())
!pip3 install gradio
!python3 app.py
# Step4: click "public URL" or "local URL", upload your images to 
# train your own model and then generate your digital twin.


2)Gradio体验页面布局优化,并同时支持中、英双语

3)支持在colab上运行

4)代码进行重构,整体更加简洁

5)  透出完整prompt和部分超参数

6)  完善README介绍

7)  支持脚本化运行训练和推理


全球开发者招募


我们希望联合开源社区的力量持续、高效地打磨该开源项目,解锁更多高阶玩法(比如人物表情包、人物连环画故事、虚拟试衣间……),并进行更深层次的算法创新,发表相应顶会论文。

image.png


如果你对该开源项目感兴趣,对该开源项目的未来有憧憬与信仰,欢迎报名加入:https://www.yuque.com/forms/share/5892d145-99c3-406c-8785-13dcb50353b8



附录


1、原理讲解图文

3张照片打造专属形象!酷蛙FaceChain解密个人写真开源项目,人人AIGC!


2、图文没看过瘾,那就来看看项目组的直播详解吧

https://developer.aliyun.com/live/252626?spm=a2c6h.26396819.creator-center.8.75e93e18htMEyA


3、纯享直播完整版~

https://developer.aliyun.com/live/252626?spm=a2c6h.26396819.creator-center.8.75e93e18htMEyA


4、Github地址

https://github.com/modelscope/facechain


5、魔搭创空间应用地址(无门槛人人都可玩起来)

https://modelscope.cn/studios/CVstudio/cv_human_portrait/summary


最后,记得点击阅读原文报名加入项目组~

https://www.yuque.com/forms/share/5892d145-99c3-406c-8785-13dcb50353b8

相关文章
|
8月前
|
人工智能 开发者
发完最后一篇论文,Stable Diffusion核心团队全要离职了
Stability AI的核心团队面临挑战,关键成员Robin Rombach离职,引发对公司技术发展和内部管理问题的担忧。尽管公司表示将继续专注技术商业化,但人才流失对保持团队稳定和创新能力构成考验。Rombach的离开既是损失,也可能带来变革机会,吸引新人才将成为Stability AI未来关键。
162 3
发完最后一篇论文,Stable Diffusion核心团队全要离职了
|
8月前
|
数据采集 自然语言处理 前端开发
社区供稿 | 猎户星空百亿参数大模型 Orion-14B系列开源,一张3060就能跑(附魔搭社区推理微调最佳实践)
1月21日,傅盛在猎户星空大模型发布会上宣布,“为企业应用而生” 的开源百亿参数猎户星空大模型正式发布。猎户星空大模型(Orion-14B)是由猎户星空研发的预训练多语言大语言模型,以其140亿参数规模展现出了卓越的性能。
|
编解码 人工智能 物联网
离FaceChain应用生态爆发还有多远?-0905迭代周记
在过去的不到一个月,FaceChain开源项目从无到有,成功突破了相关技术瓶颈,GitHub(https://github.com/modelscope/facechain)获得了超过4.6K star,为未来的应用发展奠定了坚实的基础。
离FaceChain应用生态爆发还有多远?-0905迭代周记
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
社区供稿 | 元象发布255B大规模MoE开源大模型,落地应用登顶港台榜
元象XVERSE发布 中国最大MoE开源模型:XVERSE-MoE-A36B,加速AI应用低成本部署,将国产开源提升至国际领先水平。
社区供稿 | 元象发布255B大规模MoE开源大模型,落地应用登顶港台榜
|
4月前
|
人工智能 运维 IDE
CodeFuse 开源一周年,焕新出发!
CodeFuse 是蚂蚁集团推出的开源项目,旨在通过大型代码语言模型(Code LLMs)支持软件开发生命周期各阶段,包括设计、编码、测试、部署等。自2023年9月开源以来,CodeFuse 不断迭代,推出了一系列创新产品和技术,如 CodeFuse IDE、muAgent 2.0 框架及 CGE 和 Rodimus 模型。项目已在蚂蚁集团内部广泛应用,并在多个行业会议上展示分享。未来,CodeFuse 将继续深耕开源,推出更多创新产品,并加强社区互动与合作。欢迎访问 CodeFuse 官网和 GitHub 项目主页了解更多详情。
187 0
CodeFuse 开源一周年,焕新出发!
|
5月前
|
人工智能
DataWhale AI夏令营 第四期魔搭- 大模型应用全栈开发task01笔记
DataWhale AI夏令营 第四期魔搭- 大模型应用全栈开发task01笔记
81 0
|
7月前
|
机器学习/深度学习 人工智能 算法
免训练10秒生成人物写真,FaceChain迎来最大更新版本,持续推动写真开源社区进步!
随着FaceChain FACT技术的不断成熟和开源社区的共同努力,我们期待与广大开发者和爱好者共同探索和拓展AI写真的更多可能性。
|
8月前
|
编解码 人工智能 自然语言处理
贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合!
【4月更文挑战第15天】贾佳亚团队推出Mini-Gemini模型,旨在缩小与GPT-4和Gemini的性能差距。该模型采用双视觉编码器处理高分辨率图像,提升视觉对话和推理准确性。搭配高质量数据集,增强图像理解和推理能力。Mini-Gemini在零样本基准测试中表现出色,尤其在高分辨率图像处理上。不过,模型在复杂视觉推理和计数能力上仍有改进空间。
45 1
贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合!
|
自然语言处理 测试技术 编译器
社区供稿 | 姜子牙大模型开源代码大模型Ziya-Coding-34B-v1.0 再创榜单新高,魔搭开源可体验!
使用自然语言生成高质量的代码是大模型落地中的高频需求。近日,IDEA研究院封神榜团队正式开源最新的代码大模型Ziya-Coding-34B-v1.0,我们在HumanEval Pass@1的评测上,取得了75.5的好成绩,超过了GPT-4(67.0)的得分,也成为目前已知开源模型新高。

热门文章

最新文章