阿里文娱多模态内容理解的视频智能裁剪的算法的流程是?
第一步为镜头分割,由于相邻镜头间的裁剪位置是不相关的,因此可以以镜头为单位独立进行裁剪,避免了镜头边界造成的相关问题。第二步为特征抽取,这一步通过一系列算法群对每一个镜头生成了多个和视觉显著度密切相关的特征、包括人脸和人体的检测、朝向估计、清晰度评估、追踪和识别,光流的估计,视频视觉显著度的预测。最后一步为特征的融合和裁剪位置的估计,这一步是整个算法流程中的关键部分。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。