开发者社区> 问答> 正文

Sora视频模型与传统的文生图模型在结构上有什么区别?

Sora视频模型与传统的文生图模型在结构上有什么区别?

展开
收起
夹心789 2024-07-04 12:11:38 34 0
2 条回答
写回答
取消 提交回答
  • Sora视频模型并未在参考资料中找到相关的资料。不过通常视频模型会比文生图模型更复杂,因为它们需要处理连续的帧序列,涉及时间维度的建模。文生图模型如StableDiffusion主要关注从文本到单个图像的生成,而视频模型可能结合了时间序列分析和图像生成技术,以生成连续的视频内容。可看下官方文档多模态文生图模型

    2024-07-05 10:07:09
    赞同 2 展开评论 打赏
  • Sora视频模型与传统的文生图模型在结构上的显著区别是,原来的Unet结构被替换为了diffusion Transformer的结构。

    2024-07-04 13:45:28
    赞同 展开评论 打赏
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
通义万相:视觉生成大模型的进化与应用 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载