SNOOPI：创新 AI 文本到图像生成框架，提升单步扩散模型的效率和性能

2024-12-09 101 发布于广东

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

视觉智能开放平台，分割抠图1万点

视觉智能开放平台，图像通用资源包5000点

视觉智能开放平台，视频通用资源包5000点

简介： SNOOPI是一个创新的AI文本到图像生成框架，通过增强单步扩散模型的指导，显著提升模型性能和控制力。该框架包括PG-SB和NASA两种技术，分别用于增强训练稳定性和整合负面提示。SNOOPI在多个评估指标上超越基线模型，尤其在HPSv2得分达到31.08，成为单步扩散模型的新标杆。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日跟你分享最新的 AI 资讯和开源应用，也会不定期分享自己的想法和开源实例，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

🚀 快速阅读

创新框架：SNOOPI通过PG-SB和NASA技术，提升单步扩散模型的效率和性能。
主要功能：包括提高生成效率、增强稳定性和控制性、支持负面提示引导等。
技术原理：涵盖随机尺度分类器自由引导、负向提示整合、模型输出对齐和特征过滤。

正文

SNOOPI 是什么

公众号: 蚝油菜花 - SNOOPI

SNOOPI是一个创新的文本到图像生成框架，旨在通过增强单步扩散模型的指导，提升模型的性能和控制力。该框架包括两种主要技术：PG-SB（Proper Guidance – SwiftBrush）和NASA（Negative-Away Steer Attention）。PG-SB通过随机尺度的无分类器引导方法，增强训练稳定性；NASA则通过交叉注意力机制整合负面提示，有效抑制生成图像中的不期望元素。

SNOOPI在多个评估指标上显著超越基线模型，尤其在HPSv2得分达到31.08，树立了单步扩散模型的新标杆。

SNOOPI 的主要功能

提高生成效率：将多步骤的文本到图像扩散模型简化为单步模型，显著提高生成效率，减少计算资源的需求。
增强稳定性和控制性：基于PG-SB和NASA技术，SNOOPI在训练和推理过程中提供更稳定的性能，支持对生成的图像进行更精细的控制。
支持负面提示引导：通过NASA技术，SNOOPI实现对负面提示的支持，使在图像生成过程中排除不想要的元素，提升图像生成的实际应用价值。
提升图像质量：SNOOPI能生成高质量、高分辨率的图像，其HPSv2得分达到31.08，显示了在图像质量上的优势。
跨模型背板兼容性：SNOOPI能在不同的模型背板上有效工作，包括PixArt-α、SDv1.5和SDv2.1等，显示了广泛的适用性。

SNOOPI 的技术原理

随机尺度分类器自由引导：PG-SB在训练过程中变化教师模型的指导比例，扩大输出分布，让模型适应不同的扩散模型背板，同时保持竞争力的性能。
负向提示整合：NASA基于交叉注意力机制将负面提示融入单步扩散模型中，调整中间特征空间的注意力权重，减少不希望的特征在生成图像中的出现。
模型输出对齐：VSD框架用预训练的扩散模型增强基于文本的生成，确保生成的图像与教师模型的概率密度对齐。
特征过滤：基于NASA机制，SNOOPI在特征空间中过滤掉不想要的特征，能在生成图像之前排除不需要的元素，减少混合伪影的出现。

资源

项目官网：https://snoopi-onestep.github.io/
GitHub 仓库：https://github.com/VinAIResearch/SNOOPI
HuggingFace 模型库：https://huggingface.co/papers/2412.02687
arXiv 技术论文：https://arxiv.org/pdf/2412.02687

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

SNOOPI：创新 AI 文本到图像生成框架，提升单步扩散模型的效率和性能

🚀 快速阅读

正文

SNOOPI 是什么

SNOOPI 的主要功能

SNOOPI 的技术原理

资源

计算机视觉

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

SNOOPI：创新 AI 文本到图像生成框架，提升单步扩散模型的效率和性能

🚀 快速阅读

正文

SNOOPI 是什么

SNOOPI 的主要功能

SNOOPI 的技术原理

资源

计算机视觉

热门文章

最新文章

相关课程

相关电子书

相关实验场景