3个月实现产品落地,这个GitHub 8000星的AI实时换脸项目有APP了

简介: 让视频会议不再枯燥,一键换脸,想用谁的身份开会就用谁的身份。现在,这个名为 Avatarify 的 AI 换脸项目可以在苹果商店中下载使用了。


人类对于角色扮演的热情永远不会消退,这也是 AI 换脸广受追捧的原因。

三个月前,机器之心曾介绍过一个换脸项目 Avatarify。利用这项技术,你可以将自己的脸实时替换成别人的脸,在视频会议中的表现十分流畅。迄今为止这个项目已在 GitHub 上获得了 8.5k 的 star 量。

微信图片_20211204102813.png


这个项目主要借助今年三月份发布的一篇 arXiv 论文《First Order Motion》,无需事先对目标图像进行任何训练,就能用另一个人的视频来替换自己的图像。

在使用 Avatarify 时,借助 deepfake 等其他换脸技术,在想要交换的脸部图像上对算法进行训练。通过在目标图像的相似类别上训练算法,该模型支持实时换脸操作。

微信图片_20211204102445.jpg

一阶运动模型整体框架

具体的操作过程也非常简单:

先导入一张静态图片,照片中的五官会随着视频中真人动作做出相应的变化,比如挑眉毛、眨眼睛、说话等动作,看起来就像是换了个人在开会。

更方便的是,开发者已经将它做成了 app,目前可在苹果商店下载。

网络异常,图片无法展示
|

Avatarify 已上架 APP Store。

这款应用的使用方法依然非常简单:在 app 中选择一张图片,即可开展一番表情操纵,最终生成的就是你想要的人脸视频了。

微信图片_20211204102451.jpg


也不知道是什么家庭背景,能让特朗普总统亲自为你的朋友送上生日祝福:「Happy birthday, Joe!」

网络异常,图片无法展示
|


你可以选择做个人,也可以放弃做人:

微信图片_20211204102501.gif


还有换脸界最喜欢的蒙娜丽莎:

微信图片_20211204102507.gif

蒙娜丽莎:「你喜欢我的微笑吗?」(Do you like my smile?)

试用效果

本着负责任的态度,我们对产品进行了试用。下图为真实使用效果,没有加特技的成分,可以看出,眼神转换和微笑弧度都被成功捕捉到:

微信图片_20211204102514.gif

除了 APP 提供的图像以外,你也可以自定义目标头像,但需要注意将目标头像裁剪为正方形,并且距离不能太远也不能太近。最好选择单一的背景,以最大程度上避免还原失真。

很多用户在社交平台上展示了他们的试用成果。虽然在五官动作的捕捉上比较精确,但如果加上仰头等动作的话,生成结果仍然会出现变形:

微信图片_20211204102524.gif


下图中,马斯克下半部分的脸有点跑偏:

微信图片_20211204102528.gif


当然这也和使用者的动作有关,表情管理能力越强,越能够以假乱真。

微信图片_20211204103013.png


三个月,从项目创建到产品落地

据 GitHub 项目介绍,这个项目自创建以来持续更新,具体时间表如下所示:

  • 2020.04.13:添加 Windows 支持。
  • 2020.04.15:添加 StyleGAN 生成的头像(ThisPersonDoesNotExist)。点击 Q 键,即可获得一张不存在的人的图像。每点击一次,即可轻松换头像。
  • 2020.04.17:创建 Slack 社区。
  • 2020.04.24:添加 Windows 安装教程。
  • 2020.05.07:针对所有平台添加远程 GPU 支持。
  • 2020.05.22:添加 Google Colab 模式,用户可以在没有 GPU 的计算机上运行 Avatarify。
  • 2020.07.11:添加 Docker 支持,用户可以在 Linux 上使用 Docker 运行 Avatarify。


几天前,Avatarify APP 在苹果 APP Store 上线。

从项目创建到商业化软件落地,Avatarify 的作者只用了三个多月的时间。

也许无聊真的是第一生产力。

参考链接:https://github.com/alievk/avatarify#configure-video-meeting-apphttps://avatarify.ai/

相关文章
|
2天前
|
JavaScript 前端开发 Android开发
【03】仿站技术之python技术,看完学会再也不用去购买收费工具了-修改整体页面做好安卓下载发给客户-并且开始提交网站公安备案-作为APP下载落地页文娱产品一定要备案-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-优雅草卓伊凡
【03】仿站技术之python技术,看完学会再也不用去购买收费工具了-修改整体页面做好安卓下载发给客户-并且开始提交网站公安备案-作为APP下载落地页文娱产品一定要备案-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-优雅草卓伊凡
34 13
【03】仿站技术之python技术,看完学会再也不用去购买收费工具了-修改整体页面做好安卓下载发给客户-并且开始提交网站公安备案-作为APP下载落地页文娱产品一定要备案-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-优雅草卓伊凡
|
1月前
|
人工智能 移动开发 JavaScript
如何用uniapp打包桌面客户端exe包,vue或者uni项目如何打包桌面客户端之electron开发-优雅草央千澈以开源蜻蜓AI工具为例子演示完整教程-开源代码附上
如何用uniapp打包桌面客户端exe包,vue或者uni项目如何打包桌面客户端之electron开发-优雅草央千澈以开源蜻蜓AI工具为例子演示完整教程-开源代码附上
177 18
|
19天前
|
人工智能 算法 计算机视觉
【01】opencv项目实践第一步opencv是什么-opencv项目实践-opencv完整入门以及项目实践介绍-opencv以土壤和水滴分离的项目实践-人工智能AI项目优雅草卓伊凡
【01】opencv项目实践第一步opencv是什么-opencv项目实践-opencv完整入门以及项目实践介绍-opencv以土壤和水滴分离的项目实践-人工智能AI项目优雅草卓伊凡
115 62
【01】opencv项目实践第一步opencv是什么-opencv项目实践-opencv完整入门以及项目实践介绍-opencv以土壤和水滴分离的项目实践-人工智能AI项目优雅草卓伊凡
|
3天前
|
人工智能 自然语言处理 测试技术
Potpie.ai:比Copilot更狠!这个AI直接接管项目代码,自动Debug+测试+开发全搞定
Potpie.ai 是一个基于 AI 技术的开源平台,能够为代码库创建定制化的工程代理,自动化代码分析、测试和开发任务。
93 19
Potpie.ai:比Copilot更狠!这个AI直接接管项目代码,自动Debug+测试+开发全搞定
|
9天前
|
人工智能 IDE 编译器
idea如何使用AI编程提升效率-在IntelliJ IDEA 中安装 GitHub Copilot 插件的步骤-卓伊凡
idea如何使用AI编程提升效率-在IntelliJ IDEA 中安装 GitHub Copilot 插件的步骤-卓伊凡
71 15
idea如何使用AI编程提升效率-在IntelliJ IDEA 中安装 GitHub Copilot 插件的步骤-卓伊凡
|
11天前
|
机器学习/深度学习 存储 人工智能
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
MNN-LLM App 是阿里巴巴基于 MNN-LLM 框架开发的 Android 应用,支持多模态交互、多种主流模型选择、离线运行及性能优化。
884 14
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
|
1月前
|
人工智能 数据处理 语音技术
Pipecat实战:5步快速构建语音与AI整合项目,创建你的第一个多模态语音 AI 助手
Pipecat 是一个开源的 Python 框架,专注于构建语音和多模态对话代理,支持与多种 AI 服务集成,提供实时处理能力,适用于语音助手、企业服务等场景。
108 23
Pipecat实战:5步快速构建语音与AI整合项目,创建你的第一个多模态语音 AI 助手
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
PeterCat 是一款开源的智能答疑机器人,能够自动抓取 GitHub 上的文档和 issue 构建知识库,提供对话式答疑服务,帮助开发者和社区维护者高效解决技术问题。
188 7
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
|
1月前
|
人工智能 算法 机器人
重启“APP工厂”,张一鸣要做AI时代的爱迪生?
互联网时代的弄潮儿在移动互联网浪潮中经历了起伏,而今在大模型时代再次面临挑战。字节跳动作为移动互联网时代的新贵,正以激进的姿态迎战大模型带来的变革。通过重启“APP工厂”模式,字节跳动不仅在AI应用层推出了20余款产品,还在模型层进行了大规模投入,如豆包大模型家族的发布。尽管面临资源和技术的双重挑战,字节跳动凭借其强大的执行力和战略调整能力,继续在大模型赛道上占据一席之地。然而,历史经验表明,新技术往往伴随着行业格局的重塑,字节跳动能否在这场技术革命中保持领先地位,仍需时间检验。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
MMAudio 是一个基于多模态联合训练的高质量 AI 音频合成项目,能够根据视频内容或文本描述生成同步的音频。该项目适用于影视制作、游戏开发、虚拟现实等多种场景,提升用户体验。
174 7
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频

热门文章

最新文章