FaceChain应用生态爆发?无限可能的人物应用等你加入探索!

本文涉及的产品
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,分割抠图1万点
简介: 在过去的不到一个月,FaceChain开源项目从无到有,成功突破了相关技术瓶颈,GitHub获得了超过4.6K star,为未来的应用发展奠定了坚实的基础。本文将介绍我们已经实现的一些核心功能、,以及未来一些场景的设想。文章末尾,诚邀有意向有能力的开发者加入我们!

1 核心功能进展

     在过去的不到一个月,FaceChain开源项目从无到有,成功突破了相关技术瓶颈,GitHub获得了超过4.6K star,为未来的应用发展奠定了坚实的基础。以下是我们已经实现的一些核心功能:


  • 最少1张照片就可以训练生成特定的人物LoRA,生成的人物写真照片形象鲜明又颇具美感。相关原理详见论文:https://arxiv.org/abs/2308.14256


  • 可以精准指定人物的动作和姿态

  • 已经打通LoRA风格的无限扩展,例如仙女风、拍立得港风、花园婚纱、冬季汉服、校园风等。



  • 更多风格DIY教程:

【手把手教程】无限场景风格LoRA与固定人物LoRA的融合-酷蛙FaceChain0826周记(GitHub已4K Star!)


2 应用场景设想

距离FaceChain应用生态的爆发式增长还有多远呢?我们已经设想了以下一些可能的应用场景:

  • 生成各种场景LoRA风格的人物写真(这已经实现,但还可以无限拓展)
  • 创作人物连环画故事。

  • 制作人物表情包
  • 结合sadtalker生成人物视频
  • 影视、动画角色设计及生成
  • 无限可能……


3 to do list

为了实现这些应用,FaceChain仍需攻克一些技术难题:

  • 指定某一固定背景的人物写真(需要掌握inpainting技术)。
  • 高清分辨率图片生成。
  • 图片风格的拓展(包括3D、卡通、特定动画风格如吉普力)。
  • 结合LLM+SD生成连续的图片系列形成完整故事。
  • 连续性视频的生成
  • ……


4 开发者邀请

作为一个开源项目,我们热忱欢迎更多具有创新思维和热情的开发者加入,欢迎大家火热报名

我们也会对有以下相关贡献的开发者进行表彰:


贡献项目相关的教程文章。


贡献项目在Github上的PR、issue。


在魔搭平台上同步贡献项目相关模型(如风格LoRA)、训练数据集、衍生的创空间应用。


贡献者将有机会获得项目贡献证书以及modelscope平台免费计算时长奖励,更重要的还是可以结识一群有趣的开发者共同建设一个有趣的项目


如你也认可我们的项目公约:有趣、有用、向善、向美,请跳转👉报名加入!


我们期待FaceChain开源项目能够持续发展,引领人工智能技术的新潮流。

相关文章
|
3月前
|
人工智能 C++
AI无限 码力全开
本指南详细介绍了多种开发环境的搭建步骤,包括VS Code、Visual Studio及JetBrains IDEs的安装流程,配以直观图示助您快速上手。完成安装后,通过系统化学习课程全面提升编程技能。此外,我们还提供了互动模块,涵盖代码智能补全与代码问答功能,进一步提升您的开发效率与体验。
37 2
|
7月前
|
机器学习/深度学习 人工智能 算法
阿里通义最新黑科技!“通义舞王”:让静态照片翩翩起舞,探索艺术与科技的无限可能
【1月更文挑战第2天】在科技日新月异的时代,艺术创作的疆界正以前所未有的速度拓展,,从AI作曲和音乐生成技术带来的跨风格音乐作品,到基于人工智能的诗歌与文学创作,艺术不再仅仅是人类个体情感与才华的体现,而成为人机交互、数据智能与创新思维相互融合的新领域。 近日,阿里云再次引领创新潮流,推出一款令人叹为观止的AI黑科技——通义舞王
阿里通义最新黑科技!“通义舞王”:让静态照片翩翩起舞,探索艺术与科技的无限可能
|
编解码 人工智能 物联网
离FaceChain应用生态爆发还有多远?-0905迭代周记
在过去的不到一个月,FaceChain开源项目从无到有,成功突破了相关技术瓶颈,GitHub(https://github.com/modelscope/facechain)获得了超过4.6K star,为未来的应用发展奠定了坚实的基础。
离FaceChain应用生态爆发还有多远?-0905迭代周记
|
3月前
|
机器学习/深度学习 人工智能 开发者
谷歌推世界首个AI游戏引擎,2000亿游戏产业恐颠覆!0代码生成游戏,老黄预言成真
【9月更文挑战第22天】谷歌近日推出的AI游戏引擎GameNGen,作为全球首款神经模型驱动的游戏引擎,引发了广泛关注。该引擎使用户无需编写代码即可生成游戏,并实现了与复杂环境的实时交互,显著提升了模拟质量。在单TPU上,GameNGen能以超20帧/秒的速度流畅模拟经典游戏《DOOM》。这项技术不仅简化了游戏开发流程,降低了成本,还为游戏设计带来了更多可能性。然而,它也可能改变游戏产业的商业模式和创意多样性。无论如何,GameNGen标志着游戏开发领域的一次重大革新。
57 2
|
4月前
|
自然语言处理 语音技术
|
4月前
|
人工智能 Serverless
AI 创作风潮起:函数计算探索科技与艺术的无限可能
AI 创作风潮起:函数计算探索科技与艺术的无限可能。
|
5月前
|
人工智能
[AI 快手 LivePortrait] 引领高效肖像动画新时代
快手推出了 LivePortrait,具备拼接与重定向控制的高效肖像动画,下载代码,准备环境,下载预训练权重并开始推理。
[AI 快手 LivePortrait] 引领高效肖像动画新时代
|
6月前
|
机器学习/深度学习 人工智能 算法
免训练10秒生成人物写真,FaceChain迎来最大更新版本,持续推动写真开源社区进步!
随着FaceChain FACT技术的不断成熟和开源社区的共同努力,我们期待与广大开发者和爱好者共同探索和拓展AI写真的更多可能性。
|
6月前
|
机器学习/深度学习 人工智能 算法
2024年AI辅助研发:科技遇上创意,无限可能的绽放
2024年AI辅助研发:科技遇上创意,无限可能的绽放
|
7月前
|
人工智能 自然语言处理 搜索推荐
AIGC的爆火对普通人意味着什么?
【1月更文挑战第15天】AIGC的爆火对普通人意味着什么?
89 2
AIGC的爆火对普通人意味着什么?

热门文章

最新文章