使用Python和OpenCV构建具有人体检测功能的摄像头录制器

简介: 使用Python和OpenCV构建具有人体检测功能的摄像头录制器

介绍


在本教程中,我们将探讨如何使用Python和OpenCV构建一个具有人体检测功能的摄像头录制应用程序。该应用程序允许我们从计算机的摄像头录制视频,并自动检测和提取人体存在的部分。借助YOLO目标检测算法的强大功能,我们可以轻松识别和隔离人体动作。让我们逐步深入,看看如何创建这个应用程序。


前提条件


在开始之前,请确保系统上安装了以下依赖:

  • Python 3.x
  • OpenCV库
  • 预训练的YOLO模型(yolov3.cfg和yolov3.weights)
  • VLC媒体播放器(或任何其他兼容的媒体播放器)
  • ffmpeg(命令行工具)用于视频提取


强大的技术:Python、OpenCV、YOLO和FFmpeg


项目配置


  1. 从GitHub上克隆项目存储库。
  2. 您可以在这里找到存储库。
  3. 在存储库中,您将找到一个详细的README文件,其中提供了有关设置项目的逐步说明。它包括有关先决条件、安装步骤和其他资源的信息。
  4. 按照README文件中的说明安装所需的Python包,下载预训练的YOLO模型,并在系统上设置VLC媒体播放器和ffmpeg。
  5. README文件还提供了如何配置项目的指南,包括YOLO模型文件的放置和应用程序的使用。

项目代码文件:用于摄像头录制和人体检测的Python脚本代码链接:https://github.com/g4lb/camera-recorder-with-human-detection


从摄像头录制视频

  1. 在您喜欢的代码编辑器中打开camera_recorder.py文件。
  2. 在文件内,您将找到使用OpenCV捕获摄像头视频所需的代码。这包括初始化视频捕获、设置所需的视频分辨率和配置视频编解码器。
  3. 您可以根据需要修改配置参数。例如,您可以通过更改frame_width和frame_height变量的值来调整分辨率。此外,您可以通过修改fourcc变量来尝试不同的视频编解码器。
  4. 运行camera_recorder.py脚本以开始从摄像头录制视频。您将看到来自摄像头的实时视频源,并且将创建一个新的视频文件并保存在"records"文件夹中。


通过参考项目存储库中的camera_recorder.py文件,您将找到所有必要的配置详细信息和录制视频的代码实现,使用Python和OpenCV从摄像头录制视频。


提取人体运动


在视频中检测到人体后,我们将提取存在人体的部分。所有的配置详细信息和代码实现都可以在项目存储库的human_detection.py文件中找到。


  1. 在您喜欢的代码编辑器中打开human_detection.py文件。
  2. 在文件内,您将找到使用YOLO进行人体检测并提取表示人体运动的帧所需的代码。这包括初始化YOLO模型、设置置信度阈值(conf_threshold)和定义后处理步骤。
  3. 您可以根据需要修改配置参数。例如,您可以通过更改conf_threshold变量的值来调整置信度阈值。较高的值将导致更严格的检测,而较低的值可能包括更多的假阳性。

通过参考项目存储库中的human_detection.py文件,您将找到所有必要的配置详细信息和代码实现,使用YOLO和OpenCV从录制的视频中提取人体运动。

演示:人体检测在实际操作中 — 出现并消失两次


将检测到的人体部分保存为视频


一旦我们有了表示人体运动的帧,我们将它们保存为单独的视频文件。所有的配置详细信息和代码实现都可以在项目存储库的human_detection.py文件中找到。


  1. 在您喜欢的代码编辑器中打开human_detection.py文件。
  2. 在文件内,您将找到将表示人体运动的帧保存为单独的视频文件所需的代码。这包括配置输出文件名、格式和文件路径。
  3. 您可以根据需要修改配置参数。例如,您可以更改输出文件格式、调整文件命名约定或指定不同的输出目录。
  4. 运行human_detection.py脚本以开始人体检测过程。脚本将分析"records"文件夹中的录制视频文件,检测人体运动并标识表示人体存在的帧。
  5. 视频的检测部分将以"video_timestamp_human.mp4"(例如,"video_2023–07–06_11–52–34_human.mp4")的格式保存为单独的MP4文件。

通过参考项目存储库中的human_detection.py文件,您将找到所有必要的配置详细信息和代码实现,使用OpenCV和ffmpeg将表示人体运动的帧保存为单独的视频文件。录制的视频和检测到的人体部分:records与output文件夹


挑战:subprocess.run与subprocess.call


在项目的实施过程中,使用子进程模块执行ffmpeg命令时,您可能会遇到一个挑战。子进程模块中有两个常用的函数:subprocess.run和subprocess.call。这两个函数都可以用于运行外部命令,但它们在行为和返回值方面存在一些差异。


subprocess.run函数在Python 3.5中引入,与subprocess.call相比,提供了更强大和灵活的接口。它允许捕获命令的输出,处理错误,设置超时等。另一方面,subprocess.call是一个更简单的函数,运行命令并等待其完成,不捕获输出或处理错误。


在使用ffmpeg从检测到的帧创建视频时,您可能需要在subprocess.run和subprocess.call之间做出选择。如果需要捕获输出或在视频创建过程中处理潜在的错误,subprocess.run是推荐的选择。但是,如果只需要执行命令并等待其完成而不捕获输出,subprocess.call可以是一个更简单的选择。

ffmpeg命令:从帧创建检测到的人体视频剪辑

根据您的具体需求使用适当的函数。请确保处理在执行ffmpeg命令时可能发生的错误或异常。比较:subprocess.run与subprocess.call

结论
在本教程中,我们使Python和OpenCV构建了一个具有人体检测功能的摄像头录制应用程序。我们学会了如何从摄像头录制视频,使用YOLO检测人体,并提取具有人体运动的部分。借助OpenCV和YOLO的强大功能,我们可以自动化检测和隔离人体运动的过程,为各种应用开辟了可能性,如监视、活动监测等。

相关文章
|
7月前
|
人工智能 JavaScript API
零基础构建MCP服务器:TypeScript/Python双语言实战指南
作为一名深耕技术领域多年的博主摘星,我深刻感受到了MCP(Model Context Protocol)协议在AI生态系统中的革命性意义。MCP作为Anthropic推出的开放标准,正在重新定义AI应用与外部系统的交互方式,它不仅解决了传统API集成的复杂性问题,更为开发者提供了一个统一、安全、高效的连接框架。在过去几个月的实践中,我发现许多开发者对MCP的概念理解透彻,但在实际动手构建MCP服务器时却遇到了各种技术壁垒。从环境配置的细节问题到SDK API的深度理解,从第一个Hello World程序的调试到生产环境的部署优化,每一个环节都可能成为初学者的绊脚石。因此,我决定撰写这篇全面的实
1686 67
零基础构建MCP服务器:TypeScript/Python双语言实战指南
|
7月前
|
机器学习/深度学习 算法 量子技术
GQNN框架:让Python开发者轻松构建量子神经网络
为降低量子神经网络的研发门槛并提升其实用性,本文介绍一个名为GQNN(Generalized Quantum Neural Network)的Python开发框架。
164 4
GQNN框架:让Python开发者轻松构建量子神经网络
|
5月前
|
设计模式 缓存 监控
Python装饰器:优雅增强函数功能
Python装饰器:优雅增强函数功能
303 101
|
5月前
|
缓存 测试技术 Python
Python装饰器:优雅地增强函数功能
Python装饰器:优雅地增强函数功能
249 99
|
5月前
|
存储 缓存 测试技术
Python装饰器:优雅地增强函数功能
Python装饰器:优雅地增强函数功能
231 98
|
5月前
|
缓存 Python
Python中的装饰器:优雅地增强函数功能
Python中的装饰器:优雅地增强函数功能
|
6月前
|
人工智能 自然语言处理 安全
Python构建MCP服务器:从工具封装到AI集成的全流程实践
MCP协议为AI提供标准化工具调用接口,助力模型高效操作现实世界。
1168 1
|
8月前
|
数据采集 数据可视化 JavaScript
用Python采集CBC新闻:如何借助海外代理IP构建稳定采集方案
本文介绍了如何利用Python技术栈结合海外代理IP采集加拿大CBC新闻数据。内容涵盖使用海外代理IP的必要性、青果代理IP的优势、实战爬取流程、数据清洗与可视化分析方法,以及高效构建大规模新闻采集方案的建议。适用于需要获取国际政治经济动态信息的商业决策、市场预测及学术研究场景。
|
9月前
|
SQL 安全 算法
解读 Python 3.14:模板字符串、惰性类型、Zstd压缩等7大核心功能升级
Python 3.14 引入了七大核心技术特性,大幅提升开发效率与应用安全性。其中包括:t-strings(PEP 750)提供更安全灵活的字符串处理;类型注解惰性求值(PEP 649)优化启动性能;外部调试器API标准化(PEP 768)增强调试体验;原生支持Zstandard压缩算法(PEP 784)提高效率;REPL交互环境升级更友好;UUID模块扩展支持新标准并优化性能;finally块语义强化(PEP 765)确保资源清理可靠性。这些改进使Python在后端开发、数据科学等领域更具竞争力。
391 5
解读 Python 3.14:模板字符串、惰性类型、Zstd压缩等7大核心功能升级

推荐镜像

更多