开发者社区> 问答> 正文

阿里文娱多模态内容理解的视频智能裁剪的算法的流程是?

阿里文娱多模态内容理解的视频智能裁剪的算法的流程是?

展开
收起
不语奈何 2021-03-22 10:40:50 912 0
1 条回答
写回答
取消 提交回答
  • 精于基础,广于工具,熟于业务。

    第一步为镜头分割,由于相邻镜头间的裁剪位置是不相关的,因此可以以镜头为单位独立进行裁剪,避免了镜头边界造成的相关问题。第二步为特征抽取,这一步通过一系列算法群对每一个镜头生成了多个和视觉显著度密切相关的特征、包括人脸和人体的检测、朝向估计、清晰度评估、追踪和识别,光流的估计,视频视觉显著度的预测。最后一步为特征的融合和裁剪位置的估计,这一步是整个算法流程中的关键部分。

    2021-03-22 14:11:55
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
数据+算法定义新世界 立即下载
袋鼠云基于实时计算的反黄牛算法 立即下载
Alink:基于Apache Flink的算法平台 立即下载