【数据集】以人脸关键点为例讲解:如何通过开源项目快速制作关键点数据集

简介: 【数据集】以人脸关键点为例讲解:如何通过开源项目快速制作关键点数据集

前言

  人脸关键点检测是计算机视觉中的重要任务,它在人脸识别、表情识别、人脸美化等应用中发挥着关键作用。然而,为了训练高效准确的人脸关键点检测模型,我们需要大量的标注数据集。在本篇博客中,我们将介绍如何快速制作高质量的人脸关键点数据集,以支持后续模型的训练与优化。

关键点标注信息展示

  在这里向大家介绍一款简单常见的关键点标注程序:labelme,大家可以通过这款软件进行关键点标注。在这里我以帅气的郭富城为例子进行标注五官关键点以及相应的json文件:


shell

复制代码

{
  "version": "5.2.1",
  "flags": {},
  "shapes": [
    {
      "label": "0",
      "points": [
        [
          74.02476780185759,
          130.80495356037153
        ]
      ],
      "group_id": null,
      "description": "",
      "shape_type": "point",
      "flags": {}
    },
    {
      "label": "1",
      "points": [
        [
          126.656346749226,
          136.687306501548
        ]
      ],
      "group_id": null,
      "description": "",
      "shape_type": "point",
      "flags": {}
    },
    {
      "label": "2",
      "points": [
        [
          101.26934984520125,
          169.1950464396285
        ]
      ],
      "group_id": null,
      "description": "",
      "shape_type": "point",
      "flags": {}
    },
    {
      "label": "3",
      "points": [
        [
          101.57894736842104,
          194.89164086687308
        ]
      ],
      "group_id": null,
      "description": "",
      "shape_type": "point",
      "flags": {}
    },
    {
      "label": "4",
      "points": [
        [
          45.8513931888545,
          134.82972136222912
        ]
      ],
      "group_id": null,
      "description": "",
      "shape_type": "point",
      "flags": {}
    },
    {
      "label": "5",
      "points": [
        [
          162.26006191950466,
          143.49845201238392
        ]
      ],
      "group_id": null,
      "description": "",
      "shape_type": "point",
      "flags": {}
    }
  ],
  "imagePath": "300.jpg",
  "imageData": "",
  "imageHeight": 300,
  "imageWidth": 240

标注信息获取

  分析【关键点标注信息展示】的信息,我们可以得到其组成为version 、 flags 、 shapes 、 imagePath 、 imageData 、 imageHeight 、 imageWidth 。 其中的【version 、 flags】 为固定信息,【shapes】中的信息为标注的关键点信息 , 【imagePath 、 imageData 、 imageHeight 、imageWidth】分别为图像名称 、 图像Base64编码字符串 、 图像的高 、 图像的宽。而在【shapes】中的信息仅label和points是变动的,分布代表类别和坐标点。

关键点检测

  既然需要制作人脸关键点数据集,所以人脸关键点的检测是必不可少的,我们仍然是通过开源项目进行人脸关键点检测。在这里我们选择的是人脸关键点较少的开源项目检测:【mediapipe】在这里大家可以翻阅我往期关于【mediapipe】介绍。例如:

  1. 【特效】对实时动态人脸进行马赛克及贴图马赛克处理及一些拓展
  2. 【姿态估计】从理论到实践逐步分析讲解传统姿态估计算法
  3. 【实操:人脸矫正】两次定位操作解决人脸矫正问题
  4. 一起来学MediaPipe(二)人脸面网格
  5. 一起来学MediaPipe(二)人脸面网格

在这一步骤中我们核心目的是为了使用mediapipe包对人脸关键点检测后输出:

shell

复制代码

import cv2
import mediapipe as mp
mp_face_detection = mp.solutions.face_detection
mp_drawing = mp.solutions.drawing_utils
def get_face_info(image):
    image.flags.writeable = False
    image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    results = face_detection.process(image)
    facial_axis = None
    if results.detections:
        for detection in results.detections:
            facial_axis = detection.location_data.relative_keypoints
    return facial_axis
def AxisTransformation(w, h, img_fa):
    # 左眼
    left_eye = [img_fa[0].x * h, img_fa[0].y * w]
    # 右眼
    right_eye = [img_fa[1].x * h, img_fa[1].y * w]
    # 鼻子
    nose = [img_fa[2].x * h, img_fa[2].y * w]
    # 嘴巴
    mouth = [img_fa[3].x * h, img_fa[3].y * w]
    # 左耳
    left_ear = [img_fa[4].x * h, img_fa[4].y * w]
    # 右耳
    right_ear = [img_fa[5].x * h, img_fa[5].y * w]
    points = [[left_eye], [right_eye], [nose], [mouth], [left_ear], [right_ear]]
    labels = ["left_eye", "right_eye", "nose", "mouth", "left_ear", "right_ear"]
    return points, labels

image信息获取

  通过关键点标注分析我们可以获得在image信息中需要填入的信息,其中图像的尺寸和名称较为轻易获取,我们在批量读取图像的时候通过for循环可以解决,在这里我们着重解决BASE64编码字符串的获取问题:

shell

复制代码

def get_imageData(img):
    # 将图像数据转换为Base64编码字符串
    image_data_binary = cv2.imencode(".jpg", img)[1].tobytes()
    image_data_base64 = base64.b64encode(image_data_binary).decode()
    return image_data_base64

shapes信息获取

  由于一张图内的关键点往往不是一个,是需要多个关键点组合而成的,我们从上述的分析中也可以得到shapes信息中改变的也仅仅为lebel和points信息,而group_id、description、shape_type和flags参数爆出不变。同时每个关键点的信息也都是有如下关键信息所示,我们可以这样定义一个函数进行获取shapes信息:

shell

复制代码

def get_shapes_data(points, label):
    info = {
      "label": label,
      "points": points,
      "group_id": None,
      "description": "",
      "shape_type": "point",
      "flags": {}
    }
    return info

生成标注文件

在批量生成标注数据时,我们假定是通过文件夹中的图像进行处理,基础逻辑流程为:


image.png image.png image.png

image.png

可以通过下面这段代码实现上述逻辑,我们使用四大天王的照片进行测试实验:

shell

复制代码

if __name__ == "__main__":
    img_path = "./img/"
    with mp_face_detection.FaceDetection(model_selection=0,
                                         min_detection_confidence=0.5) as face_detection:
        for name in os.listdir(img_path):
            src_img = cv2.imread(img_path + name)  # 读取原始图像
            facial_axis = get_face_info(src_img)  # 五官坐标集
            if facial_axis is not None:  # 判定关键点坐标是否存在
                Height, Width, _ = src_img.shape
                imageData = get_imageData(src_img)  # 获取图像的imageData信息
                # 标签的基础信息
                json_base = {
                    "version": "5.2.1",
                    "flags": {},
                    "shapes": None,
                    "imagePath": name,
                    "imageData": imageData,
                    "imageHeight": Height,
                    "imageWidth": Width
                }
                points, labels = AxisTransformation(Height, Width, facial_axis)  # 获取关键点坐标, 类别名称
                # 获取关键点信息
                shape_infos = []
                for epoch in range(len(points)):
                    shape_info = get_shapes_data(points[epoch], labels[epoch])
                    shape_infos.append(shape_info)
                # 对基础款进行修改
                json_base["shapes"] = shape_infos
                json.dump(json_base, open('./img/%s.json' % name[:-4], 'w'), indent=2)

生成后观察文件夹下图像及标注文件:


使用labelme检验标注结果:


结语

  周五了,匆忙中实现了一个人脸关键点数据集的快速制作脚本,仅以此篇以飨读者!这样大家可以快速制作自己的关键点数据集了,大家也可以使用Dlib包制作自己的人脸关键点或者其他开源项目制作自己的关键点数据集。


相关文章
|
2月前
|
人工智能 vr&ar 图形学
开源单图生成3D模型TripoSR的局限性分析
【2月更文挑战第25天】开源单图生成3D模型TripoSR的局限性分析
205 6
开源单图生成3D模型TripoSR的局限性分析
|
5月前
|
机器学习/深度学习 人工智能 算法
AI Earth有没有相关文档或论文介绍平台地物分类、目标提取、变化检测等算法的原理呢?
AI Earth有没有相关文档或论文介绍平台地物分类、目标提取、变化检测等算法的原理呢?
303 1
|
7月前
视觉智能平台中,如果你想批量清空人脸样本库里的样本数据
视觉智能平台中,如果你想批量清空人脸样本库里的样本数据
48 5
|
11月前
|
XML JSON 算法
计算机视觉,算法应用自定义数据集制作
计算机视觉,算法应用自定义数据集制作
|
12月前
|
算法 计算机视觉 网络架构
【项目实践】基于Mask R-CNN的道路物体检测与分割(从数据集制作到视频测试)(一)
【项目实践】基于Mask R-CNN的道路物体检测与分割(从数据集制作到视频测试)(一)
143 0
|
12月前
|
计算机视觉
【项目实践】基于Mask R-CNN的道路物体检测与分割(从数据集制作到视频测试)(二)
【项目实践】基于Mask R-CNN的道路物体检测与分割(从数据集制作到视频测试)(二)
53 0
|
机器学习/深度学习 监控 算法
基于关键点的人脸检测(概述+代码)
基于关键点的人脸检测(概述+代码)
112 0
|
机器学习/深度学习 监控 算法
智能生活垃圾检测与分类系统(UI界面+YOLOv5+训练数据集)
智能生活垃圾检测与分类系统(UI界面+YOLOv5+训练数据集)
748 0
|
PyTorch 算法框架/工具 计算机视觉
|
机器学习/深度学习 算法 计算机视觉
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(一)
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(一)
202 0
机器学习中不平衡数据集分类模型示例:乳腺钼靶微钙化摄影数据集(一)