开发者社区 问答 正文

模型如何预测后续帧的剩余tokens来生成视频?

模型如何预测后续帧的剩余tokens来生成视频?

展开
收起
夹心789 2024-06-30 22:27:21 68 分享 版权
1 条回答
写回答
取消 提交回答
  • 模型通过预测后续帧的剩余tokens来生成视频。它能够根据已编码的帧信息,预测出后续帧中缺失的tokens,从而实现视频序列的生成。这种方法展示了模型能够产生在时间上连贯的物体生成,为动态、有意义的运动提供了可能。

    2024-06-30 22:45:39
    赞同 展开评论
问答地址: