介绍
在本教程中,我们将探讨如何使用Python和OpenCV构建一个具有人体检测功能的摄像头录制应用程序。该应用程序允许我们从计算机的摄像头录制视频,并自动检测和提取人体存在的部分。借助YOLO目标检测算法的强大功能,我们可以轻松识别和隔离人体动作。让我们逐步深入,看看如何创建这个应用程序。
前提条件
在开始之前,请确保系统上安装了以下依赖:
- Python 3.x
- OpenCV库
- 预训练的YOLO模型(yolov3.cfg和yolov3.weights)
- VLC媒体播放器(或任何其他兼容的媒体播放器)
- ffmpeg(命令行工具)用于视频提取
强大的技术:Python、OpenCV、YOLO和FFmpeg
项目配置
- 从GitHub上克隆项目存储库。
- 您可以在这里找到存储库。
- 在存储库中,您将找到一个详细的README文件,其中提供了有关设置项目的逐步说明。它包括有关先决条件、安装步骤和其他资源的信息。
- 按照README文件中的说明安装所需的Python包,下载预训练的YOLO模型,并在系统上设置VLC媒体播放器和ffmpeg。
- README文件还提供了如何配置项目的指南,包括YOLO模型文件的放置和应用程序的使用。
项目代码文件:用于摄像头录制和人体检测的Python脚本代码链接:https://github.com/g4lb/camera-recorder-with-human-detection
从摄像头录制视频
- 在您喜欢的代码编辑器中打开camera_recorder.py文件。
- 在文件内,您将找到使用OpenCV捕获摄像头视频所需的代码。这包括初始化视频捕获、设置所需的视频分辨率和配置视频编解码器。
- 您可以根据需要修改配置参数。例如,您可以通过更改frame_width和frame_height变量的值来调整分辨率。此外,您可以通过修改fourcc变量来尝试不同的视频编解码器。
- 运行camera_recorder.py脚本以开始从摄像头录制视频。您将看到来自摄像头的实时视频源,并且将创建一个新的视频文件并保存在"records"文件夹中。
通过参考项目存储库中的camera_recorder.py文件,您将找到所有必要的配置详细信息和录制视频的代码实现,使用Python和OpenCV从摄像头录制视频。
提取人体运动
在视频中检测到人体后,我们将提取存在人体的部分。所有的配置详细信息和代码实现都可以在项目存储库的human_detection.py文件中找到。
- 在您喜欢的代码编辑器中打开human_detection.py文件。
- 在文件内,您将找到使用YOLO进行人体检测并提取表示人体运动的帧所需的代码。这包括初始化YOLO模型、设置置信度阈值(conf_threshold)和定义后处理步骤。
- 您可以根据需要修改配置参数。例如,您可以通过更改conf_threshold变量的值来调整置信度阈值。较高的值将导致更严格的检测,而较低的值可能包括更多的假阳性。
通过参考项目存储库中的human_detection.py文件,您将找到所有必要的配置详细信息和代码实现,使用YOLO和OpenCV从录制的视频中提取人体运动。
演示:人体检测在实际操作中 — 出现并消失两次
将检测到的人体部分保存为视频
一旦我们有了表示人体运动的帧,我们将它们保存为单独的视频文件。所有的配置详细信息和代码实现都可以在项目存储库的human_detection.py文件中找到。
- 在您喜欢的代码编辑器中打开human_detection.py文件。
- 在文件内,您将找到将表示人体运动的帧保存为单独的视频文件所需的代码。这包括配置输出文件名、格式和文件路径。
- 您可以根据需要修改配置参数。例如,您可以更改输出文件格式、调整文件命名约定或指定不同的输出目录。
- 运行human_detection.py脚本以开始人体检测过程。脚本将分析"records"文件夹中的录制视频文件,检测人体运动并标识表示人体存在的帧。
- 视频的检测部分将以"video_timestamp_human.mp4"(例如,"video_2023–07–06_11–52–34_human.mp4")的格式保存为单独的MP4文件。
通过参考项目存储库中的human_detection.py文件,您将找到所有必要的配置详细信息和代码实现,使用OpenCV和ffmpeg将表示人体运动的帧保存为单独的视频文件。录制的视频和检测到的人体部分:records与output文件夹
挑战:subprocess.run与subprocess.call
在项目的实施过程中,使用子进程模块执行ffmpeg命令时,您可能会遇到一个挑战。子进程模块中有两个常用的函数:subprocess.run和subprocess.call。这两个函数都可以用于运行外部命令,但它们在行为和返回值方面存在一些差异。
subprocess.run函数在Python 3.5中引入,与subprocess.call相比,提供了更强大和灵活的接口。它允许捕获命令的输出,处理错误,设置超时等。另一方面,subprocess.call是一个更简单的函数,运行命令并等待其完成,不捕获输出或处理错误。
在使用ffmpeg从检测到的帧创建视频时,您可能需要在subprocess.run和subprocess.call之间做出选择。如果需要捕获输出或在视频创建过程中处理潜在的错误,subprocess.run是推荐的选择。但是,如果只需要执行命令并等待其完成而不捕获输出,subprocess.call可以是一个更简单的选择。
ffmpeg命令:从帧创建检测到的人体视频剪辑
根据您的具体需求使用适当的函数。请确保处理在执行ffmpeg命令时可能发生的错误或异常。比较:subprocess.run与subprocess.call
结论
在本教程中,我们使用Python和OpenCV构建了一个具有人体检测功能的摄像头录制应用程序。我们学会了如何从摄像头录制视频,使用YOLO检测人体,并提取具有人体运动的部分。借助OpenCV和YOLO的强大功能,我们可以自动化检测和隔离人体运动的过程,为各种应用开辟了可能性,如监视、活动监测等。