视频处理
视频是由一系列图像构成的,这一系列图像被称为帧,帧是以固定的时间间隔从视频中获取的。
获取(播放)帧的速度称为帧速率,其单位通常使用“帧/秒”表示,代表在1秒内所出现的帧数,对应的英文是FPS(Frames Per Second)。
如果从视频中提取出独立的帧,就可以使用图像处理的方法对其进行处理,达到处理视频的目的。
OpenCV提供了cv2.VideoCapture类和cv2.VideoWriter类来支持各种类型的视频文件。
在不同的操作系统中,它们支持的文件类型可能有所不同,但是在各种操作系统中均支持AVI格式的视频文件。
VideoCapture类
cv2.VideoCapture类处理视频的方式非常简单、快捷,而且它既能处理视频文件又能处理摄像头信息。
类函数介绍
cv2.VideoCapture类的常用函数包括初始化、打开、帧捕获、释放、属性设置等
- 初始化OpenCV为cv2.VideoCapture类提供了构造函数cv2.VideoCapture(),用于打开摄像头并完成摄像头的初始化工作。该函数的语法格式为:
捕获对象=cv2.VideoCapture("摄像头ID号")
- “摄像头ID号”就是摄像头的ID号码。需要注意的是,这个参数是摄像设备(摄像头)的ID编号,而不是文件名。其默认值为-1,表示随机选取一个摄像头;如果有多个摄像头,则用数字“0”表示第1个摄像头,用数字“1”表示第2个摄像头,以此类推。
如果只有一个摄像头,既可以使用“0”,也可以使用“-1”作为摄像头ID号。
在某些平台上,如果该参数值为“-1”, OpenCV会弹出一个窗口,让用户手动选择希望使用的摄像头。
- “捕获对象”为返回值,是cv2.VideoCapture类的对象。
- 要初始化当前的摄像头,可以使用语句:
cap = cv2.VideoCapture(0)
- 特别强调:视频处理完以后,要记得释放摄像头对象。
该(构造)函数也能够用于初始化视频文件,初始化视频文件时,参数为文件名。
此时函数的形式为:
捕获对象=cv2.VideoCapture("文件名")
- 例如,打开当前目录下文件名为“vtest.avi”的视频文件,可以使用语句:
cap = cv2.VideoCapture('vtest.avi')
- cv2.VideoCapture.open()函数和cv2.VideoCapture.isOpened()函数一般情况下,使用cv2.VideoCapture()函数即可完成摄像头的初始化。有时,为了防止初始化发生错误,可以使用函数cv2.VideoCapture.isOpened()来检查初始化是否成功。该函数的语法格式为:
retval = cv2.VideoCapture.isOpened()
- 该函数会判断当前的摄像头是否初始化成功
- 如果成功,则返回值retval为True
- 如果不成功,则返回值retval为False
- 如果摄像头初始化失败,可以使用函数cv2.VideoCapture.open()打开摄像头。
该函数的语法格式为:
retval = cv2.VideoCapture.open( index )
- index为摄像头ID号。
- retval为返回值,当摄像头(或者视频文件)被成功打开时,返回值为True
- 同样,函数cv2.VideoCapture.isOpened()和函数cv2.VideoCapture.open()也能用于处理视频文件。在处理视频文件时,函数cv2.VideoCapture.open()的参数为文件名, 其语法格式为:
retval = cv2.VideoCapture.open( filename )
- 捕获帧摄像头初始化成功后,就可以从摄像头中捕获帧信息了。捕获帧所使用的是函数cv2.VideoCapture.read()。该函数的语法是:
retval, image=cv2.VideoCapture.read()
- image是返回的捕获到的帧,如果没有帧被捕获,则该值为空。
- retval表示捕获是否成功,如果成功则该值为True,不成功则为False
- 释放
在不需要摄像头时,要关闭摄像头。关闭摄像头使用的是函数cv2.VideoCapture.release()。
该函数的语法是:
None=cv2.VideoCapture.release()
- 例如,当前有一个VideoCapture类的对象cap,要将其释放,可以使用语句:
cap.release()
- 属性设置需要获取cv2.VideoCapture类对象的属性,或是更改该类对象的属性。函数cv2.VideoCapture.get()用于获取cv2.VideoCapture类对象的属性,该函数的语法格式是:
retval = cv2.VideoCapture.get( propId )
- 式中,参数propId对应着cv2.VideoCapture类对象的属性例如,有一个cv2.VideoCapture类对象cvc,则:
- 通过cvc.get(cv2.CAP_PROP_FRAME_WIDTH),就能获取当前帧对象的宽度。
- 通过cvc.get(cv2.CAP_PROP_FRAME_HEIGHT),就能获取当前帧对象的高度。
- 函数cv2.VideoCapture.set()用来设置cv2.VideoCapture类对象的属性。
该函数的语法是:
retval = cv2.VideoCapture.set( propId, value )
- 式中,propId对应cv2.VideoCapture类对象的属性,value对应属性propid的值。
例如,有一个cv2.VideoCapture类对象cvc,则:
- 语句ret=cvc.set(cv2.CAP_PROP_FRAME_WIDTH, 640)将当前帧对象的宽度设置为640像素。
- 语句ret=cvc.set(cv2.CAP_PROP_FRAME_HEIGHT, 480)将当前帧对象的高度设置为480像素。
- 属性值及含义
- cv2.VideoCapture.grab()函数和cv2.VideoCapture.retrieve()函数
同步多个摄像头
- 如果需要读取一个摄像头的视频数据,最简便的方法就是使用函数cv2.VideoCapture.read()。但是,如果需要同步一组或一个多头(multihead)摄像头(例如立体摄像头或Kinect)的视频数据时,该函数就无法胜任了。可以把函数cv2.VideoCapture.read()理解为是由函数cv2.VideoCapture.grab()和函数cv2.VideoCapture.retrieve()组成的。函数cv2.VideoCapture.grab()用来指向下一帧,函数cv2.VideoCapture.retrieve()用来解码并返回一帧。因此,可以使用函数cv2.VideoCapture.grab()和函数cv2.VideoCapture.retrieve()获取多个摄像头的数据。函数cv2.VideoCapture.grab()用来指向下一帧,其语法格式是:
retval= cv2.VideoCapture.grab( )
- 如果该函数成功指向下一帧,则返回值retval为True。函数cv2.VideoCapture.retrieve()用来解码,并返回函数v2.VideoCapture.grab()捕获的视频帧。该函数的语法格式为:
retval, image = cv2.VideoCapture.retrieve( )
- image为返回的视频帧,如果未成功,则返回一个空图像。
- retval为布尔型值,若未成功,返回False;否则,返回True。
- 对于一组摄像头,可以使用如下代码捕获不同摄像头的视频帧:
success0 = cameraCapture0.grab() success1 = cameraCapture1.grab() if success0 and success1: frame0 = cameraCapture0.retrieve() frame1 = cameraCapture1.retrieve()
- 与VideoCapture类内的其他函数一样,cv2.VideoCapture.grab()和cv2.VideoCapture.retrieve()也能用来读取视频文件。
捕获摄像头视频
使用cv2.VideoCapture类捕获摄像头视频。
根据题目要求,编写代码如下:
import numpy as np import cv2 cap = cv2.VideoCapture(0) while(cap.isOpened()): ret, frame = cap.read() cv2.imshow('frame', frame) c = cv2.waitKey(1) if c==27: #ESC键 break cap.release() cv2.destroyAllWindows()
播放视频文件
播放视频文件时,需要将函数cv2.VideoCapture()的参数值设置为视频文件的名称。在播放视频时,可以通过设置函数cv2.waitKey()中的参数值,来设置播放视频时每一帧的持续(停留)时间。
如果函数cv2.waitKey()中的参数值:
- 较小,则说明每一帧停留的时间较短,视频播放速度会较快。
- 较大,则说明每一帧停留的时间较长,视频播放速度会较慢。
该参数的单位是ms,通常情况下,将这个参数的值设置为25即可。( 1000 / 25 = 40)
**例子:**使用cv2.VideoCapture类播放视频文件
import numpy as np import cv2 cap = cv2.VideoCapture('viptrain.avi') while(cap.isOpened()): ret, frame = cap.read() cv2.imshow('frame', frame) c = cv2.waitKey(25) if c==27: #ESC键 break cap.release() cv2.destroyAllWindows()
VideoWriter类
OpenCV中的cv2.VideoWriter类可以将图片序列保存成视频文件,也可以修改视频的各种属性,还可以完成对视频类型的转换。
类函数介绍
cv2.VideoWriter类常用的成员函数包括:构造函数、write函数等。
- 构造函数OpenCV为cv2.VideoWriter类提供了构造函数,用它来实现初始化工作。该函数的语法格式是:
<VideoWriter object> = cv2.VideoWriter( filename, fourcc, fps, frameSize[,isColor] )
- filename指定输出目标视频的存放路径和文件名。如果指定的文件名已经存在,则会覆盖这个文件。
- fourcc表示视频编/解码类型(格式)。在OpenCV中用函数cv2.VideoWriter_fourcc()来指定视频编码格式。cv2.VideoWriter_fourcc()有4个字符参数。这4个字符参数构成了编/解码器的“4字标记”,每个编/解码器都有一个这样的标记。几个常用的标记:
- cv2.VideoWriter_fourcc(‘I’, ‘4’, ‘2’, ‘0’)表示未压缩的YUV颜色编码格式,色度子采样为4:2:0。该编码格式具有较好的兼容性,但产生的文件较大,文件扩展名为.avi。
- cv2.VideoWriter_fourcc(‘P’, ‘I’, ‘M’, ‘I’)表示MPEG-1编码类型,生成的文件的扩展名为.avi。
- cv2.VideoWriter_fourcc(‘X’, ‘V’, ‘I’, ‘D’)表示MPEG-4编码类型。如果希望得到的视频大小为平均值,可以选用这个参数组合。该组合生成的文件的扩展名为.avi。
- cv2.VideoWriter_fourcc(‘T’, ‘H’, ‘E’, ‘O’)表示Ogg Vorbis编码类型,文件的扩展名为.ogv。
- cv2.VideoWriter_fourcc(‘F’, ‘L’, ‘V’, ‘I’)表示Flash视频,生成的文件的扩展名为.flv。
更多的字符参数组合:http://www.fourcc.org
- 若参数fourcc为“-1”,则程序运行时会弹出一个对话框, 在该对话框中,用户可以根据自己的需要选择合适的压缩程序和压缩质量。
- fps为帧速率。
- frameSize为每一帧的长和宽。
- isColor表示是否为彩色图像。
- **例子: **下面的语句完成了cv2.VideoWriter类的初始化工作
fourcc = cv2.VideoWriter_fourcc(*'XVID') out = cv2.VideoWriter('output.avi', fourcc, 20, (1024,768))
- 如果希望通过对话框设置编/解码格式,可以使用语句:
fourcc = -1 out = cv2.VideoWriter('output.avi', fourcc, 20, (1024,768))
- write函数cv2.VideoWriter类中的函数cv2.VideoWriter.write()用于写入下一帧视频。该函数的语法格式为:
None=cv2.VideoWriter.write(image)
- image是要写入的视频帧。
- 通常情况下,要求彩色图像的格式为BGR模式。
在调用该函数时,直接将要写入的视频帧传入该函数即可。
例如,有一个视频帧为frame,要将其写入上面的示例中名为out的cv2.VideoWriter类对象内,则使用语句:
out.write(frame)
- 上述语句会把frame传入名为output.avi的out对象内。
- 释放
在不需要cv2.VideoWriter类对象时,需要将其释放。
释放该类对象时所使用的是函数cv2.VideoWriter.release()。
该函数的语法格式是:
None = cv2.VideoWriter.release( )
- 当前有一个cv2.VideoWriter类的对象out,可以用以下语句将其释放:
out.release()
保存视频
保存视频包括创建对象、写入视频、释放对象等多个步骤
- 创建对象在创建对象前,首先需要设置好参数。
- 设置好要保存的具体文件名,例如:filename=‘‘out.avi’’。
- 使用cv2.VideoWriter_fourcc()确定编/解码的类型,例如:fourcc =cv2.VideoWriter_fourcc(*‘XVID’)。
- 确定视频的帧速率,例如:fps=20。
- 确定视频的长度和宽度,例如:size=(640,480)。
- 然后利用上述参数,创建对象。例如:
out = cv2.VideoWriter( filename , fourcc , fps , size )
- 当然,也可以直接在构造函数内用需要的参数值创建对象。例如:
out = cv2.VideoWriter('out.avi', fourcc, 20, (640,480))
- 写入视频
用函数cv2.VideoWriter.write()在创建的对象out内写入读取到的视频帧frame。使用的代码为:
out.write(frame)
- 释放对象
在完成写入后,释放对象out。代码为:
out.release()
- **例子:**使用cv2.VideoWriter类保存摄像头视频文件。
import numpy as np import cv2 cap = cv2.VideoCapture(0) fourcc = cv2.VideoWriter_fourcc('I', '4', '2', '0') out = cv2.VideoWriter('output.avi', fourcc, 20, (640,480)) while(cap.isOpened()): ret, frame = cap.read() if ret==True: out.write(frame) cv2.imshow('frame', frame) if cv2.waitKey(1) == 27: break else: break cap.release() out.release() cv2.destroyAllWindows()
- 运行上述程序,就会捕获当前摄像头的视频内容,并将其保存在当前目录下名为“output.avi”的视频文件中。
视频操作基础
视频是由视频帧构成的,将视频帧从视频中提取出,对其使用图像处理的方法进行处理,就可以达到处理视频的目的。
例子:提取视频的Canny边缘检测结果。
import numpy as np import cv2 cap = cv2.VideoCapture('viptrain.avi') while(cap.isOpened()): ret, frame = cap.read() frame=cv2.Canny(frame,100,200) cv2.imshow('frame', frame) c = cv2.waitKey(1) # 0 是一直等待 if c==27: #ESC键 break cap.release() cv2.destroyAllWindows()