人脸数据上传方式

简介: 【8月更文挑战第2天】人脸数据上传方式。

人脸数据上传方式
在百度人脸识别API上,有3种方式上传人脸图片:BASE64字符串、URL字符串以及FACE_TOKEN字符串。
(1)BASE64:BASE64编码的图片数据,编码后的图片大小不超过2MB。
(2)URL:图片的URL地址(可能由于网络等原因导致下载图片的时间较长)。
(3)FACE_TOKEN:人脸图片的唯一标识。调用人脸检测接口时,会为每个人脸图片赋予一个唯一的FACE_TOKEN,同一张图片多次检测得到的FACE_TOKEN是同一个。
3.人脸检测
人脸检测区别于人脸识别。在一张照片中需要先找到人脸,才可以进行识别,但是一般而言,人脸检测之后也可以实现其他功能,如性别识别、年龄识别以及数字化妆等。
百度AI开放平台的人脸检测可以添加参数以返回当前人脸更为详细的信息,具体请求参数如表所示。
人脸检测具体请求参数
参数 必选 类型 说明
image 是 string base64编码后的图片数据,需使用urlencode编码,编码后的图片大小不超过2MB
max_face_num 否 uint32 最多处理人脸的数目,默认值为1,仅检测图片中面积最大的那个人脸
face_fields 否 string 包括age、beauty、expression、faceshape、gender、glasses、landmark、race、qualities信息,用逗号分隔,默认只返回人脸框、概率和旋转角度。如果要返回age等更多属性,请在此参数中添加

人脸检测部分返回参数如表所示。
人脸检测部分返回参数
参数 类型 必选 说明
log_id uint64 是 日志ID
result_num uint32 是 人脸数目
result object[] 是 人脸属性对象的集合
+age double 否 年龄。face_fields包含age时返回
+beauty double 否 美丑打分,范围为[0,100],越大表示越美。face_fields包含beauty时返回
+location object 是 人脸在图片中的位置
++left uint32 是 人脸区域离左边界的距离
++top uint32 是 人脸区域离上边界的距离
++width uint32 是 人脸区域的宽度
++height uint32 是 人脸区域的高度
+face_probability double 是 人脸置信度,范围为[0,1]
+rotation_angle int32 是 人脸框相对于竖直方向的顺时针旋转角,[-180,180]
+yaw double 是 三维旋转之左右旋转角[-90(左), 90(右)]
+pitch double 是 三维旋转之俯仰角度[-90(上), 90(下)]
+roll double 是 平面内旋转角[-180(逆时针), 180(顺时针)]
+expression uint32 否 表情:0,不笑;1,微笑;2,大笑。face_fields包含expression时返回
+expression_probability double 否 表情置信度,范围为[0,1]。face_fields包含expression时返回
+faceshape object[] 否 脸形置信度。face_fields包含faceshape时返回
++type string 是 脸形:square、triangle、oval、heart、round
++probability double 是 置信度:0~1
+gender string 否 male、female。face_fields包含gender时返回
+gender_probability double 否 性别置信度,范围为[0,1],face_fields包含gender时返回
+glasses uint32 否 是否戴眼镜,0-无眼镜,1-普通眼镜,2-墨镜。face_fields包含glasses时返回
+glasses_probability double 否 眼镜置信度,范围为[0,1],face_fields包含glasses时返回

相关文章
|
10月前
|
机器学习/深度学习 开发工具 计算机视觉
视觉智能平台常见问题之视频文件较大上传时可以分段上传或者切割视频如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
|
2月前
|
编解码 文字识别 自然语言处理
如何使用OCR技术批量识别图片中的文字并重命名文件,OCR 技术批量识别图片中的文字可能出现的错误
### 简介 【批量识别图片内容重命名】工具可批量识别图片中的文字并重命名文件,方便高效处理大量图片。然而,OCR 技术面临字符识别错误(如形近字混淆、生僻字识别不佳)、格式错误(段落错乱、换行问题)和语义理解错误等挑战。为提高准确性,建议提升图片质量、选择合适的 OCR 软件及参数,并结合自动校对与人工审核,确保最终文本的正确性和完整性。
222 12
如何使用OCR技术批量识别图片中的文字并重命名文件,OCR 技术批量识别图片中的文字可能出现的错误
|
7月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之上传素材文件不在同一地域的OSS,怎么上传多张图片
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
65 1
|
8月前
|
存储 运维 Serverless
函数计算产品使用问题之如何上传自己的图片
函数计算产品作为一种事件驱动的全托管计算服务,让用户能够专注于业务逻辑的编写,而无需关心底层服务器的管理与运维。你可以有效地利用函数计算产品来支撑各类应用场景,从简单的数据处理到复杂的业务逻辑,实现快速、高效、低成本的云上部署与运维。以下是一些关于使用函数计算产品的合集和要点,帮助你更好地理解和应用这一服务。
|
9月前
|
文字识别 安全 API
印刷文字识别产品使用合集之不想通过读取图片二进制文件的方式来传入图片内容,如何进行图片内容识别
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
9月前
|
文字识别 开发工具 Android开发
视觉智能开放平台操作报错合集之使用人脸属性检测接口,出现报错:图片无法下载,请检查链接是否可访问和本地网络情况,该如何解决
在使用视觉智能开放平台时,可能会遇到各种错误和问题。虽然具体的错误代码和消息会因平台而异,但以下是一些常见错误类型及其可能的原因和解决策略的概述,包括但不限于:1. 认证错误、2. 请求参数错误、3. 资源超限、4. 图像质量问题、5. 服务不可用、6. 模型不支持的场景、7. 网络连接问题,这有助于快速定位和解决问题。
|
9月前
|
文字识别 API 开发工具
视觉智能开放平台产品使用合集之人像分割抠图返回的图片URL是否可以直接转存到自己的储存桶
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
9月前
|
文字识别 小程序 算法
视觉智能开放平台产品使用合集之如何比对上传的图片与身份证照片是不是本人
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
9月前
|
人工智能 API 开发者
视觉智能开放平台操作报错合集之在使用人脸比对功能时报错一般是什么原因
在使用视觉智能开放平台时,可能会遇到各种错误和问题。虽然具体的错误代码和消息会因平台而异,但以下是一些常见错误类型及其可能的原因和解决策略的概述,包括但不限于:1. 认证错误、2. 请求参数错误、3. 资源超限、4. 图像质量问题、5. 服务不可用、6. 模型不支持的场景、7. 网络连接问题,这有助于快速定位和解决问题。
105 0
|
10月前
|
机器学习/深度学习 API Android开发
视觉智能平台常见问题之摄像头抓拍到包含人脸的照片如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
100 0
视觉智能平台常见问题之摄像头抓拍到包含人脸的照片如何解决