1. 安装必要的库
首先,确保您已安装以下库:
- OpenCV: 用于图像处理和计算机视觉任务
- imutils: 提供一些实用函数,如图像旋转、裁剪等
安装方法如下:
pip install opencv-python pip install imutils
2. 加载和显示视频
首先,我们需要导入所需的库,并加载一个视频文件。我们将使用OpenCV的VideoCapture
类来加载视频。
import cv2 import imutils video_path = "path/to/your/video.mp4" # 打开视频 cap = cv2.VideoCapture(video_path) while True: ret, frame = cap.read() if not ret: break # 缩放以提高处理速度 frame = imutils.resize(frame, width=600) cv2.imshow("Input Video", frame) if cv2.waitKey(1) & 0xFF == ord("q"): break cap.release() cv2.destroyAllWindows()
3. 应用预训练的人物检测模型
接下来,我们将使用OpenCV中提供的预训练模型。这里我们使用MobileNet-SSD模型,因为它在速度和准确性之间达到了很好的平衡。
prototxt_path = "path/to/your/MobileNetSSD_deploy.prototxt" model_path = "path/to/your/MobileNetSSD_deploy.caffemodel" # 加载预训练模型 net = cv2.dnn.readNetFromCaffe(prototxt_path, model_path)
4. 在检测到的人物周围绘制边界框
现在,我们将使用预训练的模型来检测视频中的人物,并在检测到的人物周围绘制边界框。
# 设置置信度阈值 confidence_threshold = 0.5 while True: ret, frame = cap.read() if not ret: break frame = imutils.resize(frame, width=600) (h, w) = frame.shape[:2] # 将图像转换为blob blob = cv2.dnn.blobFromImage(frame, 0.007843, (w, h), 127.5) net.setInput(blob) detections = net.forward() for i in range(detections.shape[2]): confidence = detections[0, 0, i, 2] if confidence > confidence_threshold: idx = int(detections[0, 0, i, 1]) if idx == 15: # 15 代表人类 box = detections[0, 0, i, 3:7] * np.array([w, h, w, h]) (startX, startY, endX, endY) = box.astype("int") # 在检测到的人物周围绘制边界框 cv2.rectangle(frame, (startX, startY), (endX, endY), (0, 255, 0), 2) cv2.imshow("Input Video", frame) if cv2.waitKey(1) & 0xFF == ord("q"): break
5. 保存和显示结果
最后,我们将处理后的视频保存到磁盘,并在程序完成后关闭所有窗口。
# 创建 VideoWriter 对象以保存处理后的视频 fourcc = cv2.VideoWriter_fourcc(*"mp4v") out = cv2.VideoWriter("output.mp4", fourcc, 30, (w, h)) while True: ret, frame = cap.read() if not ret: break frame = imutils.resize(frame, width=600) (h, w) = frame.shape[:2] blob = cv2.dnn.blobFromImage(frame, 0.007843, (w, h), 127.5) net.setInput(blob) detections = net.forward() for i in range(detections.shape[2]): confidence = detections[0, 0, i, 2] if confidence > confidence_threshold: idx = int(detections[0, 0, i, 1]) if idx == 15: box = detections[0, 0, i, 3:7] * np.array([w, h, w, h]) (startX, startY, endX, endY) = box.astype("int") cv2.rectangle(frame, (startX, startY), (endX, endY), (0, 255, 0), 2) # 将帧写入输出视频 out.write(frame) cv2.imshow("Input Video", frame) if cv2.waitKey(1) & 0xFF == ord("q"): break cap.release() out.release() cv2.destroyAllWindows()
总结:
现在,您应该已经成功地创建了一个可以识别人物出现并将其锁定的项目。通过运行此代码,您将能够在给定的视频中检测到人物,并在检测到的人物周围绘制边界框。此外,该程序将处理后的视频保存到磁盘,以便您以后查看。
本教程展示了如何使用Python和OpenCV库构建一个简单的人物识别和锁定项目。您可以在此基础上进行扩展,以满足您的特定需求。例如,您可以尝试:
- 使用其他预训练模型,以提高识别准确性或降低计算复杂性。
- 为检测到的人物添加标签,例如显示置信度分数或人物ID。
- 跟踪检测到的人物在视频中的移动轨迹。
- 将此项目扩展为实时人物识别系统,通过摄像头实时监控人物出现。