开发者社区 问答 正文

阿里文娱算法一书中介绍到多模态内容检索会遇到什么问题?

阿里文娱算法一书中介绍到多模态内容检索会遇到什么问题?

展开
收起
不语奈何 2021-03-22 10:52:18 769 分享 版权
来自: 阿里文娱技术
1 条回答
写回答
取消 提交回答
  • 精于基础,广于工具,熟于业务。

    整体来说,从一个完整的视频可以切分出不同的片段,每个片段可以拆解到镜头、关键帧、关键元素等不同粒度;对视频内容做细颗粒度拆解,将图像、视频动作、人物、声音、背景音乐等信息通过检测和识别等手段做标签化,通过上述手段完成对视频内容降维到文字模态的转换。

    2021-03-22 14:20:02
    赞同 展开评论