开发者社区 问答 正文

阿里文娱多模态内容理解的视频智能裁剪的算法的流程是?

阿里文娱多模态内容理解的视频智能裁剪的算法的流程是?

展开
收起
不语奈何 2021-03-22 10:40:50 928 分享
分享
版权
来自: 阿里文娱技术 举报
1 条回答
写回答
取消 提交回答
  • 精于基础,广于工具,熟于业务。

    第一步为镜头分割,由于相邻镜头间的裁剪位置是不相关的,因此可以以镜头为单位独立进行裁剪,避免了镜头边界造成的相关问题。第二步为特征抽取,这一步通过一系列算法群对每一个镜头生成了多个和视觉显著度密切相关的特征、包括人脸和人体的检测、朝向估计、清晰度评估、追踪和识别,光流的估计,视频视觉显著度的预测。最后一步为特征的融合和裁剪位置的估计,这一步是整个算法流程中的关键部分。

    2021-03-22 14:11:55 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等