告别潜在空间的黑箱操作，直接在原始像素空间建模！PixelFlow：港大团队开源像素级文生图模型

2025-04-17 858

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 香港大学与Adobe联合研发的PixelFlow模型，通过流匹配和多尺度生成技术实现像素级图像生成，在256×256分辨率任务中取得1.98的FID分数，支持端到端训练并突破传统模型对预训练VAE的依赖。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发感兴趣，我会每日分享大模型与 AI 领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜：蚝油菜花 🥦

🎨 "设计师失业倒计时！港大开源模型把PS按地上摩擦，文本秒变神图"

大家好，我是蚝油菜花。当同行还在为生成图像的模糊边缘和诡异细节抓狂时，这个像素级神器正在颠覆图像生成规则！

你是否经历过这些AI翻车现场：

今天要解剖的 PixelFlow ，用三大核心理念重塑图像生成：

已有团队用它1分钟生成商业级海报，文末附《像素级生成实战指南》——准备好迎接图像生成2.0时代了吗？

🚀 快速阅读

该模型实现了像素级图像生成的突破性进展。

PixelFlow 是什么

PixelFlow

PixelFlow 是首个直接在像素空间进行端到端训练的生成模型，通过级联流建模技术实现高效高质图像生成。其核心突破在于绕过了传统模型对潜在空间的依赖，在原始像素维度完成数据分布建模。

模型采用多阶段优化策略，从低分辨率开始逐步提升图像细节，结合改进的Transformer架构处理不同分辨率特征。这种设计使得模型在保持生成质量的同时，显存占用仅为同类模型的20%。

conda create -n pixelflow python=3.12
conda activate pixelflow

pip install torch==2.6.0
pip install -r requirements.txt

python app.py --checkpoint ./checkpoints/class2image.ckpt --class_cond

torchrun --nnodes=1 --nproc_per_node=8 train.py configs/pixelflow_xl_c2i.yaml

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜：蚝油菜花 🥦