开发者社区 问答 正文

学术界对多模态搜索大多采用了什么解决方案?

学术界对多模态搜索大多采用了什么解决方案? image.png

展开
收起
Pony马 2021-03-10 20:12:26 3679 分享 版权
来自: 阿里文娱技术
1 条回答
写回答
取消 提交回答
  • 学术界喜欢这种端到端的解决方案的,对于短小视频的理解,可能是个不错的方 案。但针对长视频,这些方案是很难真正做到准确的理解的。因为长视频包含内容信 息是更多维,更宽泛。

    2021-03-12 16:38:31
    赞同 展开评论
问答标签: