镜头边界检测（下）| 学习笔记-阿里云开发者社区

镜头边界检测（下）| 学习笔记

2022-11-21 311

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习镜头边界检测（下），介绍了镜头边界检测（下）系统机制，以及在实际应用过程中如何使用。

开发者学堂课程【高校精品课-华中科技大学 -智能媒体计算：镜头边界检测（下）】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/811/detail/15700

镜头边界检测（下）

内容介绍

一、前言

二、基于边缘特征

三、基于变换特征

四、基于运动特征

五、基于深度学习的镜头边界检测方法

六、镜头边界检测的评价指标

一、前言

前面是切变的检测，这一课讲解渐变的检测。这是一个比较经典的算法，尽管它本身不是特别的准确，但它的思路是后面其他算法的基础。这是由在金山的张洪江博士于上个世纪90年代提出的，叫做双重比较法，即采用两个阈值来检测镜头变换。

在一个镜头内部，切变时会出现一个峰值，而渐变时没有明显的峰值。在镜头内部的帧间差很小，渐变的过程里帧间差变大，但没有峰值，尤其是当一个镜头内部有物体的运动时，也会偶尔出现阈值变大的情况。

根据张洪江博士所说检测步骤，首先设置两个阈值 Tb 和 Ts （ Ts < Tb ），分别是镜头切换和渐变的阈值，用较低的阈值 Ts 来确定渐变过程的起始帧，如果两个连续帧的直方图差 d （ Hi ， Hi + 1）满足 Ts < d （ Hi ， Hi + 1 ） < Tb ，则它们被认为很可能是渐变的开始。一旦检出这种帧，就开始进行帧间直方图差累计 Ac （ i ），如果发现下一帧它又变小了，认为这不是渐变开始，如果累加一直都变大，直到大于 Tb ，并且两帧之间又小于 Ts 时，则认为是渐变结束。

两帧之差变小，说明已经进入另一个镜头内部，但实际上，由于镜头变换类型复杂度太高，这个算法的准确率并不是特别高，且实用性也不高，后面根据这个算法做相应的改进，于是有了后面的一些算法。

二、基于边缘特征

通过边缘检测，当相邻两帧的边缘位置的差别较大的时，则认为发生了镜头的变换。即在图像里面找边缘，存在 i +1帧中，与第 i 帧中最近的边缘像素的距离大于r，即它边缘数发生变化。变化数大约一个阈值时，就认为发生了镜头变换。这个方法在一些运动视频里面效果不错，比如说乒乓球比赛（如图），但不是对所有的视频效果都好。

图片9.png

该方法有个特点，由于需要边缘检测和预处理，其计算成本很高，但它能解决光照变化问题，有一些其他因素，例如相机变焦操作等，使得错检率很高。

三、基于变换特征

然后将边缘特征变换到频域去，即基于变换的镜头边界检测方法，就是将帧图像从空间域变换到变换域，常见的变换有傅立叶变换、小波变换、离散余弦变换等等。

基本流程是先将图像进行分块，然后呢对第 i 帧中块 n ，在第 i +1帧中的块 n' 的周围块中找到最佳的匹配块 p ，然后计算这两帧图像的相似矩阵（如图）。

图片10.png

在计算匹配块时，需要计算块之间的相关性，由于在空间域的计算代价大，因此将其转到领域再进行计算。

四、基于运动特征

计算相邻两帧图像块的运动向量（ Motion Vector ），用以区别镜头的变换和相机操作（如缩放或平移等），其缺点是快匹配的计算量巨大。将图像分割成多个不重叠的块，然后对第 i 帧中块 n ，将其与第 i +1帧中的每一块执行块匹配，找到匹配块 n’ ，并计算匹配值和运动参数匹配值的有序集合为：