无限生成视频,还能规划决策,扩散强制整合下一token预测与全序列扩散

简介: 【8月更文挑战第15天】在AI领域,新训练范式“扩散强制”(DF)为序列生成模型带来革新。DF通过独立噪声级去噪token,实现稳定且可变长度的序列生成,支持引导生成高价值序列。其核心机制使模型学习揭露不同噪声级别的token。在视频预测等领域,DF展现出生成长序列的一致性及通过蒙特卡洛树引导提高决策质量的能力。理论与实证均验证了DF的有效性,尽管现有实现受限于小型RNN,未来有望拓展至更大模型与数据集。[论文](https://arxiv.org/pdf/2407.01392)

在人工智能领域,序列生成模型一直是研究的热点,尤其是在自然语言处理、视频预测和决策制定等方面。最近,一种名为“扩散强制”(Diffusion Forcing,简称DF)的新训练范式引起了广泛关注。这种方法通过将扩散模型训练为去噪一系列具有独立噪声水平的token,展示了其在序列生成建模中的潜力。与传统的下一token预测模型和全序列扩散模型相比,DF不仅能够生成可变长度的序列,还能在连续数据中稳定生成,同时接受引导以生成高奖励的序列。

扩散强制(DF)的核心在于将每个token与一个随机的、独立的噪声水平相关联,并通过共享的下一token或未来几个token的预测模型来去噪。这种方法的灵感来自于将噪声视为部分掩蔽的一种形式——零噪声意味着token未被掩蔽,而完全噪声则完全掩蔽了token。因此,DF迫使模型学习如何“揭开”任何集合的可变噪声token。

在序列生成方面,DF被实现为因果扩散强制(Causal Diffusion Forcing,简称CDF),其中未来的token依赖于过去的token,通过因果架构进行去噪。CDF在采样时逐渐将高斯噪声帧去噪为干净样本,不同帧在每个去噪步骤中可能具有不同的噪声水平。与下一token预测模型类似,CDF可以生成可变长度的序列;与下一token预测不同,它能够稳定地从下一个token到数千个token的未来生成——即使是连续的token。此外,与全序列扩散类似,CDF也接受引导,以生成高奖励的序列。

通过在视频生成、模型基规划、视觉模仿学习和时间序列预测等多个领域的广泛评估,DF展示了其独特的能力。例如,在视频预测方面,DF能够稳定地生成长序列,即使超出训练序列长度,也能保持一致性,而不会像传统的教师强制和全序列扩散基线那样迅速发散。在决策制定方面,DF通过蒙特卡洛树引导(Monte Carlo Tree Guidance,简称MCTG)显著提高了高奖励序列的采样能力,这在非因果全序列扩散模型中是无法实现的。

DF不仅在实证研究中取得了成功,还在理论上证明了其优化目标的有效性。具体来说,DF的训练过程优化了一个关于所有token子序列的联合分布的变分下界。这意味着,DF不仅能够生成训练集中的所有可能子序列,还能在优化过程中考虑到这些子序列的分布。

尽管DF在多个领域展示了其潜力,但其当前的因果实现基于小型RNN,对于更高分辨率的视频或更复杂的分布,可能需要大型的变换器模型。此外,DF在互联网规模的数据集和任务中的扩展行为尚未得到充分研究。未来的工作可能会探索DF在时间序列生成建模之外的应用,并将其扩展到更大的数据集。

论文地址:https://arxiv.org/pdf/2407.01392

目录
相关文章
|
3月前
|
机器学习/深度学习 编解码
Sora视频重建与创新路线问题之通过多尺度策略提升视频的生成质量该如何操作
Sora视频重建与创新路线问题之通过多尺度策略提升视频的生成质量该如何操作
|
4月前
|
机器学习/深度学习 搜索推荐 知识图谱
图神经网络加持,突破传统推荐系统局限!北大港大联合提出SelfGNN:有效降低信息过载与数据噪声影响
【7月更文挑战第22天】北大港大联手打造SelfGNN,一种结合图神经网络与自监督学习的推荐系统,专攻信息过载及数据噪声难题。SelfGNN通过短期图捕获实时用户兴趣,利用自增强学习提升模型鲁棒性,实现多时间尺度动态行为建模,大幅优化推荐准确度与时效性。经四大真实数据集测试,SelfGNN在准确性和抗噪能力上超越现有模型。尽管如此,高计算复杂度及对图构建质量的依赖仍是待克服挑战。[详细论文](https://arxiv.org/abs/2405.20878)。
80 5
|
6月前
|
机器学习/深度学习 数据可视化
数据分享|R语言生存分析模型因果分析:非参数估计、IP加权风险模型、结构嵌套加速失效(AFT)模型分析流行病学随访研究数据
数据分享|R语言生存分析模型因果分析:非参数估计、IP加权风险模型、结构嵌套加速失效(AFT)模型分析流行病学随访研究数据
|
机器学习/深度学习 数据采集 算法
序列模型算法在上网行为管理中的应用:精度提升的新途径
当我们谈论如何通过序列模型算法来提升上网行为管理的精度时,其实是一种超级有用的工具,可以帮助我们更轻松地识别和管理用户的行为,让网络管理员更加高效地监管网络活动。下面是一些有趣的方法,可以通过序列模型算法来提高上网行为管理的准确性——
178 1
|
6月前
|
定位技术 计算机视觉 Windows
生态学建模:增强回归树(BRT)预测短鳍鳗生存分布和影响因素
生态学建模:增强回归树(BRT)预测短鳍鳗生存分布和影响因素
|
6月前
|
定位技术 计算机视觉 Windows
R语言生态学建模:增强回归树(BRT)预测短鳍鳗生存分布和影响因素
R语言生态学建模:增强回归树(BRT)预测短鳍鳗生存分布和影响因素
|
6月前
|
机器学习/深度学习 算法 数据可视化
机器学习-生存分析:如何基于随机生存森林训练乳腺癌风险评估模型?
机器学习-生存分析:如何基于随机生存森林训练乳腺癌风险评估模型?
115 1
|
6月前
马尔可夫转换模型研究交通伤亡人数事故时间序列预测
马尔可夫转换模型研究交通伤亡人数事故时间序列预测
|
6月前
R语言估计多元标记的潜过程混合效应模型(lcmm)分析心理测试的认知过程
R语言估计多元标记的潜过程混合效应模型(lcmm)分析心理测试的认知过程
|
6月前
|
计算机视觉
模型落地必备 | 南开大学提出CrossKD蒸馏方法,同时兼顾特征和预测级别的信息
模型落地必备 | 南开大学提出CrossKD蒸馏方法,同时兼顾特征和预测级别的信息
161 0