引言
本文主要是基于OpenCV+MediaPipe实现了视频与摄像头中人体俯卧撑实时计数。附完整源码与实现步骤讲解,供小伙伴们学习。感谢大家的点赞关注,更多干活内容持续更新~
实现效果
详细实现步骤讲解
1.导入必要的库
import cv2 import mediapipe as mp import numpy as np
- cv2:OpenCV库,用于视频处理和图像显示。
- mediapipe:Google开发的用于处理媒体数据的跨平台解决方案。
- numpy:用于科学计算的库,这里用于处理坐标和角度计算。
2.定义计算角度的函数
def calculate_angle(a, b, c): # 将输入点转换为numpy数组 a = np.array(a) b = np.array(b) c = np.array(c) # 计算两个向量的角度差(弧度) radians = np.arctan2(c[1] - b[1], c[0] - b[0]) - np.arctan2(a[1] - b[1], a[0] - b[0]) # 转换为角度(度) angle = np.abs(radians * 180.0 / np.pi) # 确保角度在0到360度之间 if angle > 180.0: angle = 360 - angle return angle
这个函数接收三个点的坐标,计算这三个点构成的夹角,并返回角度值。
3.初始化MediaPipe的Pose实例
mp_drawing = mp.solutions.drawing_utils mp_pose = mp.solutions.pose # 初始化MediaPipe Pose实例 pose = mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5)
这部分代码导入MediaPipe的绘图工具和Pose解决方案,并创建一个Pose对象,用于处理姿态检测。
4.开始视频流处理
cap = cv2.VideoCapture('01.mp4')
创建一个VideoCapture对象,从指定的视频文件中读取帧。
5. 初始化俯卧撑计数器变量
counter = 0 stage = None max_angle = 160 min_angle = 60
定义了用于记录俯卧撑次数的counter,以及当前动作阶段stage,以及判断俯卧撑完成的最小和最大角度阈值。
6. 主循环,处理每一帧视频
while cap.isOpened(): # 读取视频帧 ret, frame = cap.read()
在循环中,处理每一帧视频,进行姿态检测、角度计算和俯卧撑计数。
7.姿态检测和角度计算
# Recolor image to RGB image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB) image.flags.writeable = False # Make detection results = pose.process(image)
这部分将视频帧转换为RGB格式,以便MediaPipe处理,然后进行姿态检测。
8. 计算关节坐标和角度
try: landmarks = results.pose_landmarks.landmark # 获取左肩、左肘和左腕的坐标 shoulder = [landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].x, landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].y] elbow = [landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].x, landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].y] wrist = [landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].x, landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].y]
从检测结果中提取关键点坐标,计算肘部到肩部的角度。
9.显示角度和更新计数器
if angle > max_angle: stage = "down" if angle < min_angle and stage == 'down': stage = "up" counter += 1 print(counter)
根据计算出的角度判断当前动作阶段,当达到特定条件时增加俯卧撑计数。
10. 在视频帧上绘制结果和计数信息
mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS, mp_drawing.DrawingSpec(color=(245, 117, 66), thickness=2, circle_radius=2), mp_drawing.DrawingSpec(color=(245, 66, 230), thickness=2, circle_radius=2) ) cv2.imshow('Mediapipe Feed', image)
在图像上绘制关键点和连接线,同时显示俯卧撑计数和动作阶段
11. 用户退出循环
if cv2.waitKey(10) & 0xFF == ord('q'): break
如果用户按下’q’键,退出循环。
12. 结束视频处理
cap.release() cv2.destroyAllWindows()
释放视频资源,关闭所有OpenCV窗口。
2.完整源码
#coding:utf-8 # 导入必要的库 import cv2 import mediapipe as mp import numpy as np # 定义计算角度的函数 def calculate_angle(a, b, c): # 将输入点转换为numpy数组 a = np.array(a) b = np.array(b) c = np.array(c) # 计算两个向量的角度差(弧度) radians = np.arctan2(c[1] - b[1], c[0] - b[0]) - np.arctan2(a[1] - b[1], a[0] - b[0]) # 转换为角度(度) angle = np.abs(radians * 180.0 / np.pi) # 确保角度在0到360度之间 if angle > 180.0: angle = 360 - angle return angle # 导入MediaPipe的绘图工具和Pose解决方案 mp_drawing = mp.solutions.drawing_utils mp_pose = mp.solutions.pose # 初始化MediaPipe Pose实例 pose = mp_pose.Pose(min_detection_confidence=0.5, min_tracking_confidence=0.5) # 打开视频 cap = cv2.VideoCapture('1.mp4') # 计数器变量 counter = 0 # 当前动作阶段 stage = None # 完成俯卧撑的最大角度 max_angle = 160 # 准备开始俯卧撑的最小角度 min_angle = 60 while cap.isOpened(): # 读取视频帧 ret, frame = cap.read() # BGR图像转为RGB,便于MediaPipe处理 image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB) image.flags.writeable = False # 使用MediaPipe进行姿态检测 results = pose.process(image) # 重新转为BGR image.flags.writeable = True image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR) # 获取姿态关键点 try: landmarks = results.pose_landmarks.landmark # 获取左肩、左肘和左腕的坐标 shoulder = [landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].x, landmarks[mp_pose.PoseLandmark.LEFT_SHOULDER.value].y] elbow = [landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].x, landmarks[mp_pose.PoseLandmark.LEFT_ELBOW.value].y] wrist = [landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].x, landmarks[mp_pose.PoseLandmark.LEFT_WRIST.value].y] # 计算并显示肘部到肩部的角度 angle = calculate_angle(shoulder, elbow, wrist) cv2.putText(image, str(angle), tuple(np.multiply(elbow, [640, 480]).astype(int)), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 2, cv2.LINE_AA) print(angle) # 根据角度更新俯卧撑计数 if angle > max_angle: stage = "down" if angle < min_angle and stage == 'down': stage = "up" counter += 1 print(counter) except: pass # 在图像上绘制矩形框,用于显示计数和阶段 cv2.rectangle(image, (0, 0), (225, 73), (245, 117, 16), -1) # 在矩形框内显示计数和阶段 cv2.putText(image, 'COUNTER', (15, 22), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 0), 1, cv2.LINE_AA) cv2.putText(image, str(counter), (35, 60), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), 2, cv2.LINE_AA) cv2.putText(image, 'STAGE', (135, 22), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 0), 1, cv2.LINE_AA) cv2.putText(image, stage, (130, 60), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), 2, cv2.LINE_AA) # 在图像上绘制关键点和连接线 mp_drawing.draw_landmarks(image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS, mp_drawing.DrawingSpec(color=(245, 117, 66), thickness=2, circle_radius=2), mp_drawing.DrawingSpec(color=(245, 66, 230), thickness=2, circle_radius=2) ) # 显示处理后的图像 cv2.imshow('Mediapipe Feed', image) # 检查是否按下'q'键退出 if cv2.waitKey(10) & 0xFF == ord('q'): break # 释放视频资源,关闭所有OpenCV窗口 cap.release() cv2.destroyAllWindows()