小红书开源「InstantID」,2024第一个爆火的Al写真项目,惊艳了!

简介: 小红书开源「InstantID」,2024第一个爆火的Al写真项目,惊艳了!

马斯克与郭德纲,一位是相声界的顶流,一位是科技界的大咖。

想象一下,他们的形象融合,会是什么样?

小红书最新推出的开源项目 —— InstantID 让这种“跨界融合”成为可能。

来瞧瞧,“马德纲”有惊艳到你吗?



InstantID 是一个基于扩散模型的图像生成解决方案,能实现从单一参考图像到多样化风格化写真的快速生成。

它能让自由地将两张面孔进行合成,利用 ID 插值创造出全新的形象。


惊艳的是,它可以在不需要任何训练的情况下,根据一张人脸照片和一段文本提示,生成具有个性化风格和高保真度的 AI 写真。


写真效果非常逼真,能保持人脸特征的统一,风格融合得很好。
InstantID 开源后迅速在 GitHub 斩获 5000+ 星标,霸榜HuggingFace Space Trending榜首。开源地址:
https://github.com/InstantID/InstantID

深度学习三巨头之一 Yann LeCun 也点赞该项目。



不来体验试试,都说不过去了,用户教程先奉上!

一张自拍 + 一张参考姿势图(可选)+ Prompt(可选) + 风格选择 = 你想要生成的 AI 写真


如何快速上手呢?Demo 演示一波:

1. 上传带有人脸的图片。对于多人图像,InstantID 只会检测最大的脸部。请确保脸部不要太小,并且没有明显遮挡或模糊。


2. (可选)上传另一张图像作为参考姿势。如果没有上传,InstantID 将使用第一张图像来提取姿势。如果在步骤 1 中使用了裁剪后的脸部,建议上传它以提取新的姿势。


3. (可选)可以选择多个 ControlNet 模型来控制生成过程。默认设置是仅使用 IdentityNet。ControlNet 模型包括姿势骨架、精巧和深度。方便您可以调整每个 ControlNet 模型的强度以控制生成过程。


4. (可选)输入文本 Prompt提示词。就像所有文生图应用中所做的那样。


5. 点击 Submit 按钮开始定制写真。


6. 与朋友分享定制写真,尽情享受吧!

除了线上体验,InstantID 可以作为一个可适配的插件,能够与流行的预训练文本到图像扩散模型(如 SD 1.5 和 SDXL)无缝集成,兼容性佳。



如图所述, InstantID 方法主要包含三个关键组成部分:
(1)将弱对齐的 CLIP 特征替换为强语义的人脸特征;(2)人脸图像的特征在 Cross-Attention 中作为 Image Prompt 嵌入;(3)提出 IdentityNet 来对人脸施加强语义和弱空间的条件控制,从而增强 ID 的保真度以及文本的控制力。InstantID 保持了良好的文本编辑能力,使 ID 能够丝滑地嵌入到各种风格当中。加装饰、改发色、换套装,都毫无问题。

实验结果表明,InstantID 不仅超越目前基于单张图片特征进行嵌入的方法(IP-Adapter-FaceID),还与 ROOP、LoRAs 等方法在特定场景下不分伯仲,成本还低。



InstantID 彻底颠覆大家的想象,它摒弃了多图参考和复杂的调整步骤。在人像面部特征的保持上,InstantID 表现出色,其一致性和自然度远超传统的 LoRA 模型。

InstantID 提供了丰富的创意玩法,如ID 插值、多风格融合、定制夸张表情、动漫主题写真等,这些都极大地拓宽了用户的创作空间,让图像生成变得更加灵活和个性化。


快来加入这场创意的盛宴,体验 InstantID 带来的无限乐趣!欢迎 Star!论文标题:InstantID: Zero-shot Identity-Preserving Generation in Seconds论文地址:https://arxiv.org/abs/2401.07519代码地址:https://github.com/InstantID/InstantID项目地址:https://instantid.github.ioDemo 体验:https://huggingface.co/spaces/InstantX/InstantID

相关文章
|
7月前
【RAPHAEL】商汤发力prompt,免费开源的图文模型!我写下了湖心亭看雪与桃花源记
【RAPHAEL】商汤发力prompt,免费开源的图文模型!我写下了湖心亭看雪与桃花源记
53 0
社区供稿 | 魔搭Agent创意挑战赛作品体验感受
近期在闲逛知乎时看到魔搭发起了一个Agent创新应用比赛,看了下奖金还挺高的呀( •̀ ω •́ )y
|
2月前
|
人工智能 自然语言处理 数据挖掘
利用小蜜蜂AI智能问答ChatGPT+AI高清绘图生成图文故事案例
利用小蜜蜂AI智能问答ChatGPT+AI高清绘图生成图文故事案例
61 1
|
3月前
|
人工智能 自然语言处理 安全
【通义】AI视界|谷歌推出AI搜索功能“问照片”,照片一问即得……
本文汇总了AI领域的最新动态,包括谷歌推出的“问照片”功能,使用户能用自然语言检索Google Photos;OpenAI的商业用户激增及ChatGPT的广泛应用;Anthropic发布的企业级AI助手Claude Enterprise;美英欧盟首个人工智能法律约束条约;OpenAI前首席科学家新公司获巨额融资;以及比尔·盖茨对AI前景的乐观展望与安全建议。
|
4月前
|
人工智能 开发工具 git
一看就会的 AI 换脸项目教程!5分钟速通明星大模型开源项目一键部署
有了通义灵码的帮助,很多明星大模型项目实操过程中遇到的问题:查找错误、解释代码、优化代码、查找文档、代码补全等等都可以用通义灵码一键解决,而且准确率很高,加上灵活的实操环境,项目跑起来会非常高效。关键是通义灵码个人版还免费!
|
5月前
|
人工智能 自然语言处理 vr&ar
AI 做海报都这么厉害了?设计师不容错过的 DALL·E 3 进阶玩法~
AI 做海报都这么厉害了?设计师不容错过的 DALL·E 3 进阶玩法~
81 0
|
自然语言处理 测试技术 编译器
社区供稿 | 姜子牙大模型开源代码大模型Ziya-Coding-34B-v1.0 再创榜单新高,魔搭开源可体验!
使用自然语言生成高质量的代码是大模型落地中的高频需求。近日,IDEA研究院封神榜团队正式开源最新的代码大模型Ziya-Coding-34B-v1.0,我们在HumanEval Pass@1的评测上,取得了75.5的好成绩,超过了GPT-4(67.0)的得分,也成为目前已知开源模型新高。
|
7月前
|
人工智能 编解码 Java
用户投稿:这款 AI 编码工具 CodeFuse 很惊艳
在 AI 时代,总是会迅速出现很多惊艳的产品工具,这些效率工具,在很大程度上推动了科技的进步。特别是在编程领域,各类工具更是层出不穷,从 GitHub Copilot 到 CodeGeeX,再到通义灵码,有很多工具在不断涌现。今天,我想和大家分享一款我最近发现的、非常出色的编程辅助工具 —— CodeFuse。
357 0
用户投稿:这款 AI 编码工具 CodeFuse 很惊艳
|
人工智能
AI绘画关键词网站推荐 :轻松获取百万个提示词!完全免费
AI绘画关键词网站推荐 :轻松获取百万个提示词!完全免费
542 0
|
机器学习/深度学习 云安全 人工智能
文心千帆:PPT 制作、数字人主播一键开播等应用场景惊艳到我了,下面给到Prompt工程详细教程应用场景及案例
文心千帆:PPT 制作、数字人主播一键开播等应用场景惊艳到我了,下面给到Prompt工程详细教程应用场景及案例
文心千帆:PPT 制作、数字人主播一键开播等应用场景惊艳到我了,下面给到Prompt工程详细教程应用场景及案例
下一篇
DataWorks