实战| 手把手教你实现俯卧撑实时计数:OpenCV+MediaPipe

简介: 实战| 手把手教你实现俯卧撑实时计数:OpenCV+MediaPipe


引言

本文主要是基于OpenCV+MediaPipe实现了视频与摄像头中人体俯卧撑实时计数。附完整源码与实现步骤讲解,供小伙伴们学习。感谢大家的点赞关注,更多干活内容持续更新~

实现效果

详细实现步骤讲解

1.导入必要的库

import cv2
import mediapipe as mp
import numpy as np
  • cv2:OpenCV库,用于视频处理和图像显示。
  • mediapipe:Google开发的用于处理媒体数据的跨平台解决方案。
  • numpy:用于科学计算的库,这里用于处理坐标和角度计算。

2.定义计算角度的函数

def calculate_angle(a, b, c):
    # 将输入点转换为numpy数组
    a = np.array(a)
    b = np.array(b)
    c = np.array(c)
    # 计算两个向量的角度差(弧度)
    radians = np.arctan2(c[1] - b[1], c[0] - b[0]) - np.arctan2(a[1] - b[1], a[0] - b[0])
    # 转换为角度(度)
    angle = np.abs(radians * 180.0 / np.pi)
    # 确保角度在0到360度之间
    if angle > 180.0:
        angle = 360 - angle
    return angle

这个函数接收三个点的坐标,计算这三个点构成的夹角,并返回角度值。

3.初始化MediaPipe的Pose实例

mp_drawing = mp.solutions.drawing_utils
mp_pose = mp.solutions.pose
# 初始化MediaPipe Pose实例
pose = mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5)

这部分代码导入MediaPipe的绘图工具和Pose解决方案,并创建一个Pose对象,用于处理姿态检测。

4.开始视频流处理

cap = cv2.VideoCapture('01.mp4')

创建一个VideoCapture对象,从指定的视频文件中读取帧。

5. 初始化俯卧撑计数器变量

counter = 0
stage = None
max_angle = 160
min_angle = 60

定义了用于记录俯卧撑次数的counter,以及当前动作阶段stage,以及判断俯卧撑完成的最小和最大角度阈值。

6. 主循环,处理每一帧视频

while cap.isOpened():
    # 读取视频帧
    ret, frame = cap.read()

在循环中,处理每一帧视频,进行姿态检测、角度计算和俯卧撑计数。

7.姿态检测和角度计算

# Recolor image to RGB
image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
image.flags.writeable = False
# Make detection
results = pose.process(image)

这部分将视频帧转换为RGB格式,以便MediaPipe处理,然后进行姿态检测。

8. 计算关节坐标和角度

try:
    landmarks = results.pose_landmarks.landmark
        # 获取左肩、左肘和左腕的坐标
        shoulder = [landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].x,
                    landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].y]
        elbow = [landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].x, landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].y]
        wrist = [landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].x, landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].y]

从检测结果中提取关键点坐标,计算肘部到肩部的角度。

9.显示角度和更新计数器

if angle > max_angle:
    stage = "down"
if angle < min_angle and stage == 'down':
    stage = "up"
    counter += 1
    print(counter)

根据计算出的角度判断当前动作阶段,当达到特定条件时增加俯卧撑计数。

10. 在视频帧上绘制结果和计数信息

mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS,
                          mp_drawing.DrawingSpec(color=(245, 117, 66), thickness=2, circle_radius=2),
                          mp_drawing.DrawingSpec(color=(245, 66, 230), thickness=2, circle_radius=2)
                          )
cv2.imshow('Mediapipe Feed', image)

在图像上绘制关键点和连接线,同时显示俯卧撑计数和动作阶段

11. 用户退出循环

if cv2.waitKey(10) & 0xFF == ord('q'):
    break

如果用户按下’q’键,退出循环。

12. 结束视频处理

cap.release()
cv2.destroyAllWindows()

释放视频资源,关闭所有OpenCV窗口。

2.完整源码

#coding:utf-8
# 导入必要的库
import cv2
import mediapipe as mp
import numpy as np
# 定义计算角度的函数
def calculate_angle(a, b, c):
    # 将输入点转换为numpy数组
    a = np.array(a)
    b = np.array(b)
    c = np.array(c)
    # 计算两个向量的角度差(弧度)
    radians = np.arctan2(c[1] - b[1], c[0] - b[0]) - np.arctan2(a[1] - b[1], a[0] - b[0])
    # 转换为角度(度)
    angle = np.abs(radians * 180.0 / np.pi)
    # 确保角度在0到360度之间
    if angle > 180.0:
        angle = 360 - angle
    return angle
# 导入MediaPipe的绘图工具和Pose解决方案
mp_drawing = mp.solutions.drawing_utils
mp_pose = mp.solutions.pose
# 初始化MediaPipe Pose实例
pose = mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5)
# 打开视频
cap = cv2.VideoCapture('1.mp4')
# 计数器变量
counter = 0
# 当前动作阶段
stage = None
# 完成俯卧撑的最大角度
max_angle = 160
# 准备开始俯卧撑的最小角度
min_angle = 60
while cap.isOpened():
    # 读取视频帧
    ret, frame = cap.read()
    # BGR图像转为RGB,便于MediaPipe处理
    image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    image.flags.writeable = False
    # 使用MediaPipe进行姿态检测
    results = pose.process(image)
    # 重新转为BGR
    image.flags.writeable = True
    image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)
    # 获取姿态关键点
    try:
        landmarks = results.pose_landmarks.landmark
        # 获取左肩、左肘和左腕的坐标
        shoulder = [landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].x,
                    landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].y]
        elbow = [landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].x, landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].y]
        wrist = [landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].x, landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].y]
        # 计算并显示肘部到肩部的角度
        angle = calculate_angle(shoulder, elbow, wrist)
        cv2.putText(image, str(angle),
                    tuple(np.multiply(elbow, [640, 480]).astype(int)),
                    cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 2, cv2.LINE_AA)
        print(angle)
        # 根据角度更新俯卧撑计数
        if angle > max_angle:
            stage = "down"
        if angle < min_angle and stage == 'down':
            stage = "up"
            counter += 1
            print(counter)
    except:
        pass
    # 在图像上绘制矩形框,用于显示计数和阶段
    cv2.rectangle(image, (0, 0), (225, 73), (245, 117, 16), -1)
    # 在矩形框内显示计数和阶段
    cv2.putText(image, 'COUNTER', (15, 22),
                cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 0), 1, cv2.LINE_AA)
    cv2.putText(image, str(counter),
                (35, 60),
                cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), 2, cv2.LINE_AA)
    cv2.putText(image, 'STAGE', (135, 22),
                cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 0), 1, cv2.LINE_AA)
    cv2.putText(image, stage,
                (130, 60),
                cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), 2, cv2.LINE_AA)
    # 在图像上绘制关键点和连接线
    mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS,
                              mp_drawing.DrawingSpec(color=(245, 117, 66), thickness=2, circle_radius=2),
                              mp_drawing.DrawingSpec(color=(245, 66, 230), thickness=2, circle_radius=2)
                              )
    # 显示处理后的图像
    cv2.imshow('Mediapipe Feed', image)
    # 检查是否按下'q'键退出
    if cv2.waitKey(10) & 0xFF == ord('q'):
        break
# 释放视频资源,关闭所有OpenCV窗口
cap.release()
cv2.destroyAllWindows()

相关文章
|
3月前
|
算法 计算机视觉
基于qt的opencv实时图像处理框架FastCvLearn实战
本文介绍了一个基于Qt的OpenCV实时图像处理框架FastCvLearn,通过手撕代码的方式详细讲解了如何实现实时人脸马赛克等功能,并提供了结果展示和基础知识回顾。
149 7
|
3月前
|
文字识别 计算机视觉 开发者
基于QT的OCR和opencv融合框架FastOCRLearn实战
本文介绍了在Qt环境下结合OpenCV库构建OCR识别系统的实战方法,通过FastOCRLearn项目,读者可以学习Tesseract OCR的编译配置和在Windows平台下的实践步骤,文章提供了技术资源链接,帮助开发者理解并实现OCR技术。
179 9
基于QT的OCR和opencv融合框架FastOCRLearn实战
|
2月前
|
机器学习/深度学习 算法 计算机视觉
【Python篇】Python + OpenCV 全面实战:解锁图像处理与视觉智能的核心技能
【Python篇】Python + OpenCV 全面实战:解锁图像处理与视觉智能的核心技能
109 2
|
3月前
|
计算机视觉
基于QT的opencv插件框架qtCvFrameLearn实战
这篇文章详细介绍了如何基于Qt框架开发一个名为qtCvFrameLearn的OpenCV插件,包括项目配置、插件加载、Qt与OpenCV图像转换,以及通过各个插件学习OpenCV函数的使用,如仿射变换、卡通效果、腐蚀、旋转和锐化等。
62 10
|
2月前
|
机器学习/深度学习 算法 计算机视觉
基于opencv与mediapipe的民族舞舞蹈动作识别
基于opencv与mediapipe的民族舞舞蹈动作识别
54 0
|
6月前
|
机器学习/深度学习 算法 数据库
【功能超全】基于OpenCV车牌识别停车场管理系统软件开发【含python源码+PyqtUI界面+功能详解】-车牌识别python 深度学习实战项目
【功能超全】基于OpenCV车牌识别停车场管理系统软件开发【含python源码+PyqtUI界面+功能详解】-车牌识别python 深度学习实战项目
|
6月前
|
监控 安全 计算机视觉
实战 | 18行代码轻松实现人脸实时检测【附完整代码与源码详解】Opencv、人脸检测
实战 | 18行代码轻松实现人脸实时检测【附完整代码与源码详解】Opencv、人脸检测
|
6月前
|
人工智能 算法 Ubuntu
【案例实战】 基于OpenCV实现鹿茸面积计算
有人询问如何计算鹿茸蜡皮面积占比。利用OpenCV实验大师工具软件,经过图像处理步骤(包括边缘检测、轮廓识别),成功计算出两个区域的面积,展示了一步到位的OpenCV解决方案。OEMTS软件旨在促进数字图像处理教学,助力成为合格的OpenCV开发者。详情见课程链接和OEMTS安装指南。
78 0
|
7月前
|
数据采集 数据挖掘 计算机视觉
最全OpenCV-Python实战(3)——OpenCV中绘制图形与文本,面试官必问问题及答案
最全OpenCV-Python实战(3)——OpenCV中绘制图形与文本,面试官必问问题及答案
|
2月前
|
计算机视觉
Opencv学习笔记(三):图像二值化函数cv2.threshold函数详解
这篇文章详细介绍了OpenCV库中的图像二值化函数`cv2.threshold`,包括二值化的概念、常见的阈值类型、函数的参数说明以及通过代码实例展示了如何应用该函数进行图像二值化处理,并展示了运行结果。
577 0
Opencv学习笔记(三):图像二值化函数cv2.threshold函数详解

热门文章

最新文章