BlockDance:扩散模型加速革命!复旦字节联手实现50%无损提速

简介: BlockDance 是复旦大学与字节跳动联合推出的扩散模型加速方法,通过识别重用相邻时间步中的结构相似特征,减少冗余计算,最高可加速50%,同时保持生成质量。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


⏱️ 「别让AI画画等成PPT!国产黑科技让Stable Diffusion飙车」

大家好,我是蚝油菜花。你是否也经历过这些AI炼丹惨案——

  • 👉 等4K图生成等到咖啡凉透,结果手部还是八爪鱼
  • 👉 公司算力账单比市场部预算还高,CTO眼神逐渐核善
  • 👉 想实时改图却被进度条PUA,创意火花死在加载中...

今天要破局的 BlockDance 正在重构生成式AI速度法则!这个学术派加速神器:

  • 时空特征捕手:智能识别95%冗余计算,Diffusion模型直接瘦身
  • ✅ 「无损加速」黑盒:强化学习动态分配资源,4K图生成提速50%
  • ✅ 字节复旦双buff:已整合进最新视频生成管线,秒出高清序列

已有游戏公司用它实时渲染CG,广告团队靠它批量生成营销素材——你的扩散模型,是时候开启「涡轮增压」模式了!

🚀 快速阅读

BlockDance 是一种用于加速扩散模型推理的新方法。

  1. 核心功能:通过减少冗余计算,显著提升推理速度,同时保持生成质量。
  2. 技术原理:基于特征相似性分析、缓存与重用机制,以及强化学习优化,实现高效加速。

BlockDance 是什么

BlockDance

BlockDance 是复旦大学与字节跳动智能创作团队联合推出的一种扩散模型加速方法。它通过识别重用相邻时间步中结构相似的时空特征(STSS),减少冗余计算,从而提升推理速度,最高可加速50%。

BlockDance 专注于去噪后期的结构特征,避免因重用低相似度特征导致的图像质量下降。此外,BlockDance 还引入了 BlockDance-Ada,基于强化学习动态分配计算资源,根据不同实例的复杂性调整加速策略,进一步优化内容质量和推理速度。

BlockDance 的主要功能

  • 加速推理过程:基于减少冗余计算,将 DiTs 的推理速度提升 25% 至 50%,提高模型在实际应用中的效率。
  • 保持生成质量:在加速的同时,保持与原始模型一致的生成效果,确保图像和视频的视觉质量、细节表现和对提示的遵循程度。
  • 动态资源分配:基于 BlockDance-Ada,根据不同生成任务的复杂性动态调整计算资源分配,实现更优的速度与质量平衡。
  • 广泛的适用性:支持无缝应用于多种扩散模型和生成任务,如图像生成、视频生成等,具有很强的通用性。

BlockDance 的技术原理

  • 特征相似性分析:在扩散模型的去噪过程中,相邻时间步的特征之间存在高度相似性,尤其是在模型的浅层和中层模块中。模块主要负责生成图像的结构信息,结构信息在去噪过程的早期阶段就已经相对稳定。BlockDance 基于分析特征的相似性,识别出结构相似的时空特征(Structurally Similar Spatio-Temporal,STSS),作为加速的关键点。
  • 缓存与重用机制:将去噪过程分为“缓存步骤”和“重用步骤”。在缓存步骤中,模型保存当前步骤中某些模块的特征输出。在后续的重用步骤中,模型直接使用之前缓存的特征,跳过模块的重复计算,节省计算资源。
  • 动态决策网络(BlockDance-Ada):引入 BlockDance-Ada,基于强化学习的轻量级决策网络。根据当前生成任务的复杂性(例如图像的结构复杂性、对象数量等),动态决定哪些步骤应该进行缓存,哪些步骤能进行重用。动态调整机制让 BlockDance 在不同的生成任务和模型上实现更优的速度与质量平衡。
  • 强化学习优化:用强化学习中的策略梯度方法训练决策网络。基于设计奖励函数,平衡图像质量和计算效率之间的权衡。奖励函数包括图像质量奖励(如视觉美感、对提示的遵循程度)和计算奖励(如重用步骤的比例)。基于最大化预期奖励,决策网络能学习到最优的缓存和重用策略,在保持生成质量的同时实现最大的加速效果。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关实践学习
使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
机器学习/深度学习
基于PaddleGAN精准唇形合成模型实现美女表白视频
基于PaddleGAN精准唇形合成模型实现美女表白视频
2504 0
基于PaddleGAN精准唇形合成模型实现美女表白视频
|
4月前
|
存储 机器学习/深度学习 PyTorch
大模型训练显存优化实战指南:如何用有限显卡炼出“大丹”
本文是大模型显存优化实战指南,揭秘训练中80%显存消耗源于优化器状态。作者maoku系统梳理九大关键技术:混合精度、梯度检查点、ZeRO分片、算子融合等,助你用2–4张A100(而非8–16张)高效训练7B模型,成本直降75%,让中小企业与个人研究者也能“炼出大丹”。
|
5月前
|
人工智能 图形学 异构计算
阿里云GPU服务器NVIDIA L20 GPU卡收费价格,GPU计算型gn8is实例规格族2026年最新整理
阿里云GPU服务器gn8is实例搭载NVIDIA L20卡,单卡48GB显存,支持FP8加速,专为30B–70B大模型推理与图形处理优化。2026年最新月付价:6919元起(8核64G+1卡),最高55354元(128核1024G+8卡)。
1451 1
|
NoSQL 测试技术 Redis
Redis学习笔记之集群重启和遇到的坑
Redis学习笔记之集群重启和遇到的坑
4679 0
Redis学习笔记之集群重启和遇到的坑
|
12月前
|
机器学习/深度学习 自然语言处理 安全
ACL 2025 | GALLa:用图结构增强代码大模型,让代码理解更精准!
通过级联多模态架构将代码结构图对齐到大模型表征中
872 69
|
机器学习/深度学习 人工智能 缓存
MHA2MLA:0.3%数据微调!复旦团队开源推理加速神器,KV缓存狂降96.87%
MHA2MLA是复旦大学、华东师范大学、上海AI Lab等机构联合推出的数据高效微调方法,通过引入多头潜在注意力机制(MLA),显著优化基于Transformer的LLM推理效率,降低推理成本。
630 1
MHA2MLA:0.3%数据微调!复旦团队开源推理加速神器,KV缓存狂降96.87%
|
10月前
|
编解码 人工智能 小程序
魔搭社区模型速递(8.17-8.23)
🙋魔搭ModelScope本期社区进展:📟1652个模型,📁216个数据集,🎨54个创新应用,📄 4篇内容
1004 8
魔搭社区模型速递(8.17-8.23)
|
9月前
|
人工智能 编解码 数据可视化
AI创作更自由: 魔搭FLowBench云端工作流上线AIGC专区!支持QwenImageEdit免费出图!
很高兴向大家宣布,ModelScope AIGC 专区的工作流功能正式上线!
1417 22
|
10月前
|
人工智能
AI界的篮球赛AI-BA来了,NBA中国赛2025比赛门票等你来拿
AI界的篮球赛AI-BA来了,NBA中国赛2025比赛门票等你来拿
268 9

热门文章

最新文章