开发者社区 问答 正文

Sora视频模型与传统的文生图模型在结构上有什么区别?

Sora视频模型与传统的文生图模型在结构上有什么区别?

展开
收起
夹心789 2024-07-04 12:11:38 93 分享 版权
2 条回答
写回答
取消 提交回答
  • Sora视频模型并未在参考资料中找到相关的资料。不过通常视频模型会比文生图模型更复杂,因为它们需要处理连续的帧序列,涉及时间维度的建模。文生图模型如StableDiffusion主要关注从文本到单个图像的生成,而视频模型可能结合了时间序列分析和图像生成技术,以生成连续的视频内容。可看下官方文档多模态文生图模型

    2024-07-05 10:07:09
    赞同 2 展开评论
  • Sora视频模型与传统的文生图模型在结构上的显著区别是,原来的Unet结构被替换为了diffusion Transformer的结构。

    2024-07-04 13:45:28
    赞同 展开评论
问答地址: