Mtcnn进行人脸剪裁和对齐

简介: 1 from scipy import misc 2 import tensorflow as tf 3 import detect_face 4 import cv2 5 import matplotlib.

 

 1 from scipy import misc
 2 import tensorflow as tf
 3 import detect_face
 4 import cv2
 5 import matplotlib.pyplot as plt
 6 # %pylab inline
 7 
 8 minsize = 20  # minimum size of face
 9 threshold = [0.6, 0.7, 0.7]  # three steps's threshold
10 factor = 0.709  # scale factor
11 margin = 44
12 frame_interval = 3
13 batch_size = 1000
14 image_size = 182
15 input_image_size = 160
16 
17 print('Creating networks and loading parameters')
18 
19 with tf.Graph().as_default():
20     gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.6)
21     sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options, log_device_placement=False))
22     with sess.as_default():
23         pnet, rnet, onet = detect_face.create_mtcnn(sess, 'D:\\pycode\\real-time-deep-face-recognition-master\\20170512-110547')
24 
25 image_path = 'D:\\Users\\a\\Pictures\\test_pho\\5.jpg'
26 
27 img = misc.imread(image_path)
28 bounding_boxes, _ = detect_face.detect_face(img, minsize, pnet, rnet, onet, threshold, factor)
29 nrof_faces = bounding_boxes.shape[0]  # 人脸数目
30 print('找到人脸数目为:{}'.format(nrof_faces))
31 
32 print(bounding_boxes)
33 
34 crop_faces = []
35 for face_position in bounding_boxes:
36     face_position = face_position.astype(int)
37     print(face_position[0:4])
38     cv2.rectangle(img, (face_position[0], face_position[1]), (face_position[2], face_position[3]), (0, 255, 0), 2)
39     crop = img[face_position[1]:face_position[3],
40            face_position[0]:face_position[2], ]
41 
42     crop = cv2.resize(crop, (96, 96), interpolation=cv2.INTER_CUBIC)
43     print(crop.shape)
44     crop_faces.append(crop)
45     print(crop)
46     plt.imshow(crop)
47     plt.show()
48 
49 plt.imshow(img)
50 plt.show()

 

 

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
8月前
|
机器学习/深度学习 算法 Shell
【实操:人脸矫正】两次定位操作解决人脸矫正问题
【实操:人脸矫正】两次定位操作解决人脸矫正问题
255 0
|
JSON 数据格式 Python
对Labelme标注图像,进行90、180、270的旋转,实现标注数据的扩充。
对Labelme标注图像,进行90、180、270的旋转,实现标注数据的扩充。
1134 0
对Labelme标注图像,进行90、180、270的旋转,实现标注数据的扩充。
|
7月前
|
算法 Python
扭曲图像 鼻子拉伸
【6月更文挑战第28天】
35 0
|
8月前
|
算法 计算机视觉
缩放图像
【5月更文挑战第12天】缩放图像。
49 5
|
8月前
|
计算机视觉 索引
【OpenCV】—ROI区域图像叠加&图像混合
【OpenCV】—ROI区域图像叠加&图像混合
ENVI:影像的规则裁剪和不规则裁剪
ENVI:影像的规则裁剪和不规则裁剪
400 0
|
C++ 计算机视觉
C++-图像目标区裁剪ImageCropping
C++-图像目标区裁剪ImageCropping
108 0
|
机器学习/深度学习 存储 编解码
|
机器学习/深度学习 存储 编解码
|
机器学习/深度学习 存储 编解码
底层视觉与黑白图像上色
底层视觉(即视觉增强)是计算机视觉中的一个分支,它专注于提高图像整体的观看体验。如果 “中高层视觉” 关注的是如何让计算机理解图像中的内容,那么底层视觉则致力于解决图像的清晰度、色彩、时序等各类画质问题。这些问题的出现与拍摄环境、设备等因素有关,而视觉增强技术则旨在修复这些问题,提供更好的视觉观看体验。

热门文章

最新文章