离FaceChain应用生态爆发还有多远?-0905迭代周记

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 在过去的不到一个月,FaceChain开源项目从无到有,成功突破了相关技术瓶颈,GitHub(https://github.com/modelscope/facechain)获得了超过4.6K star,为未来的应用发展奠定了坚实的基础。

核心功能进展



在过去的不到一个月,FaceChain开源项目从无到有,成功突破了相关技术瓶颈,GitHub(https://github.com/modelscope/facechain获得了超过4.6K star,为未来的应用发展奠定了坚实的基础。


以下是我们已经实现的一些核心功能:

1、最少1张照片就可以训练特定的人物LoRA,生成的人物写真照片形象鲜明又颇具美感。相关原理详见论文:https://arxiv.org/abs/2308.14256 


2、可以精准指定人物的动作和姿态


3、已经实现了LoRA风格的无限扩展,例如仙女风、拍立得港风、花园婚纱、冬季汉服、校园风等。



更多项目资料都在这里:https://modelscope.cn/brand/view/FaceChain



应用场景设想



距离FaceChain应用生态的爆发式增长还有多远呢?我们已经设想了以下一些可能的应用场景:


生成各种场景LoRA风格的人物写真(这已经实现,但还可以无限拓展)


创作人物连环画故事



制作人物表情包




结合sadtalker生成人物视频

https://live.csdn.net/v/326197


影视、动画角色设计及生成

无限可能……



To Do List



为了实现这些应用,FaceChain仍需攻克一些技术难题:


  • 指定某一固定背景的人物写真(需要掌握inpainting技术)。
  • 高清分辨率图片生成。
  • 图片风格的拓展(包括3D、卡通、特定动画风格如吉普力)。
  • 结合LLM+SD生成连续的图片系列形成完整故事。
  • 连续性视频的生成
  • ……



开发者邀请



作为一个开源项目,我们热忱欢迎更多具有创新思维和热情的开发者加入,各个子项目虚位以待:


我们也会对有以下相关贡献的开发者进行表彰:

  • 贡献项目相关的教程文章。
  • 贡献项目在Github上的PR、issue。
  • 在魔搭平台上同步贡献项目相关模型(如风格LoRA)、训练数据集、衍生的创空间应用。


贡献者将有机会获得项目贡献证书以及modelscope平台免费计算时长奖励,更重要的还是可以结识一群有趣的开发者共同建设一个有趣的项目。


如你也认可我们的项目公约:有趣、有用、向善、向美,请跳转原文报名加入!

我们期待FaceChain开源项目能够持续发展,引领人工智能技术的新潮流。



直播预告


有更多技术细节还可以关注本周五《AI模型社》的直播,有原理讲解+实操演示,可码预约直播:


报名链接:https://survey.aliyun.com/apps/zhiliao/9h-tR9Cv1

相关文章
|
机器学习/深度学习 人工智能 编解码
Sora到底牛在哪 | AI爆发的大趋势下,普通人真正该学的是什么
Sora炸裂了的地方,在于它能理解自然语言,知道那个画面该是怎么样的,它学习很多视频内容(大力出奇迹,需要很多算力),而且一上来就是能制作60s的视频,刚好是短视频的需求,之前的AI视频生成的时间都很短(几秒钟).
|
7月前
|
机器学习/深度学习 人工智能 PyTorch
模型手动绑骨3天,AI花3分钟搞定!UniRig:清华开源通用骨骼自动绑定框架,助力3D动画制作
UniRig是清华大学与VAST联合研发的自动骨骼绑定框架,基于自回归模型与交叉注意力机制,支持多样化3D模型的骨骼生成与蒙皮权重预测,其创新的骨骼树标记化技术显著提升动画制作效率。
1034 27
模型手动绑骨3天,AI花3分钟搞定!UniRig:清华开源通用骨骼自动绑定框架,助力3D动画制作
|
9月前
|
数据采集 机器学习/深度学习 人工智能
SkyReels-V1:短剧AI革命来了!昆仑开源视频生成AI秒出影视级短剧,比Sora更懂表演!
SkyReels-V1是昆仑万维开源的首个面向AI短剧创作的视频生成模型,支持高质量影视级视频生成、33种细腻表情和400多种自然动作组合。
1178 92
SkyReels-V1:短剧AI革命来了!昆仑开源视频生成AI秒出影视级短剧,比Sora更懂表演!
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
32B小模型竟能吊打百亿参数?GLM-4-Air-0414:智谱AutoGLM沉思背后的模型,智能体开发迎来新纪元
GLM-4-Air-0414是智谱公司推出的320亿参数开源基座模型,通过优化预训练数据和对齐策略,在工具调用、联网搜索和代码生成等智能体任务中展现出卓越性能。
407 15
32B小模型竟能吊打百亿参数?GLM-4-Air-0414:智谱AutoGLM沉思背后的模型,智能体开发迎来新纪元
|
7月前
|
人工智能 前端开发 Java
2025 开发必备:精选免费 AI 辅助工具,效率狂飙不停
2025年,AI技术深度融入编程领域,诞生了多款免费且功能强大的辅助工具。通义灵码精通200多种语言,可快速生成代码框架,提升开发效率超10%,还为新手提供学习指导。Google Gemini Code Assist每月完成18万次代码补全,支持智能交互与代码审查,优化团队协作。飞算JavaAI专注Java全流程开发,从需求分析到代码生成实现十倍提效。这些工具大幅降低编程门槛,助力开发者高效高质完成任务。
|
机器学习/深度学习 人工智能 开发者
谷歌推世界首个AI游戏引擎,2000亿游戏产业恐颠覆!0代码生成游戏,老黄预言成真
【9月更文挑战第22天】谷歌近日推出的AI游戏引擎GameNGen,作为全球首款神经模型驱动的游戏引擎,引发了广泛关注。该引擎使用户无需编写代码即可生成游戏,并实现了与复杂环境的实时交互,显著提升了模拟质量。在单TPU上,GameNGen能以超20帧/秒的速度流畅模拟经典游戏《DOOM》。这项技术不仅简化了游戏开发流程,降低了成本,还为游戏设计带来了更多可能性。然而,它也可能改变游戏产业的商业模式和创意多样性。无论如何,GameNGen标志着游戏开发领域的一次重大革新。
290 2
|
机器学习/深度学习 自然语言处理 算法
【天幕系列 03】深度学习领域的最新前沿:2024年的关键突破与趋势
【天幕系列 03】深度学习领域的最新前沿:2024年的关键突破与趋势
1715 3
|
关系型数据库 MySQL 数据安全/隐私保护
MySql-8.0.27-winx64安装,超详细
MySql-8.0.27-winx64安装,超详细
539 0
|
数据挖掘 数据处理 API
使用TransBigData组件实现个人手机定位功能
使用TransBigData组件实现个人手机定位功能
299 0

热门文章

最新文章