文档备案控制台

开发者社区视觉智能人脸人体正文

阿里视觉智能开放平台（灵杰AI开放服务）【评测】人脸活体检测、智能美肤、文字识别等功能很多等待你的开发

2023-02-28 3030

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 阿里视觉智能开放平台（灵杰AI开放服务）DetectLivingFace 人脸活体检测、智能美肤、文字识别等功能很多等待你的开发

阿里视觉智能开放平台之DetectLivingFace 人脸活体检测

人脸活体检测（DetectLivingFace）能力可以检测图片中的人脸是否为来自认证设备端的近距离裸拍活体人脸对象，可广泛应用在人脸实时采集场景，满足人脸注册认证的真实性和安全性要求。活体判断的前置条件是图像中有人脸。具有针对手机、门禁机、考勤机、PC智能终端认证设备场景下的对翻拍、PS图片、打印图片、高仿模具等作弊攻击的高精度拦截的核心产品优势。广泛适用于系统人脸登录防攻击、门禁闸机刷脸通行、金融远程身份认证等实人认证场景。产品通过标准API被轻量化集成，让所有开发者可一键拥有人脸活体检测能力。

1.人体人脸

1.1人脸检测与五官定位

功能描述

人脸检测与五官定位能力可以检测图片中的人脸并给出每张人脸定位和关键点信息。输出人脸数量、人脸矩形坐标、人脸姿态、双瞳孔中心坐标、人脸置信度列表等信息。支持检测含有多张人脸的照片。

应用场景

人脸关键点检测，是后续识别、分析和特效应用的基础。它为人脸识别、表情分析、疲劳检测、三维人脸重建、人脸美颜、换脸等人脸相关应用提供了人脸精确信息。

特色优势

1.稠密关键点：提供105个关键点，足以应对人脸识别、姿态矫正、换脸等要求高精度人脸定位的应用。
2.适应能力强：适应最大90度侧脸，平面360旋转人脸等情景。适用于各种应用场景。
3.支持多人脸：支持在同张图中检测上千个人脸。

实战测试

快速识别出授权图像中人脸数量和区域，输出数量、矩行坐标、姿态、双瞳孔中心坐标、105关键点等信息，可支持多人场景的检测。更多开源免费模型体验及下载，详见魔搭社区：FLCM人脸关键点置信度模型、RetinaFace人脸检测关键点模型、MogFace人脸检测模型-large、TinyMog人脸检测器-tiny、Mtcnn人脸检测关键点模型、ULFD人脸检测模型-tiny

可以看出在多人、单人、跨年龄层都取得不错的效果

1.2 人脸活体检测

功能描述

人脸活体检测能力可以检测图片中的人脸是否为来自认证设备端的近距离裸拍活体人脸对象，可广泛应用在人脸实时采集场景，满足人脸注册认证的真实性和安全性要求。活体判断的前置条件是图像中有人脸。

能力范围来看：

1. 认证设备端是指借助近距离裸拍活体正面人脸用于认证、通行等服务场景的含RGB摄像头的硬件设备，常见的认证设备端有手机、门禁机、考勤机、PC等智能终端认证设备。

2. 裸拍活体正面人脸是指真人未经重度PS、风格化、人工合成等后处理的含正面人脸（非模糊、遮挡、大角度的正面人脸）的照片。常见的非真人有纸张人脸、电子屏人脸等；常见经过重度PS后处理的照片有摆拍街景照、摆拍人物风景照、摆拍证件照等；常见的其他后处理及生成照片有动漫人脸、绘画人脸等。

应用场景

系统人脸登录防攻击：通过检测上传的图像是否为真人实拍，而非攻击及PS等后处理照片，以防止攻击者登录系统带来安全风险。
门禁闸机刷脸通行：面向人脸注册和认证环节设备端实时的活体检测，实现注册与认证过程中的真人校验，防止非法分子盗用、伪造他人身份打卡通行。
智慧酒店自助入住：在酒店前台自助办理入住场景中，运用活体检测技术实现无人监管场景下，住客非活体攻击（纸张人脸、电子屏人脸）的高效率拦截。
金融远程身份认证：面向投资理财、基金交易、保险理赔等金融业务的活体检测需求，高效率实现对翻拍、PS图片、打印图片、高仿模具等攻击的拦截，确保用户身份真实。

特色优势

基于图片中人像目标的高维度特征（风格化、摩尔纹、成像畸形等），判断目标对象是否为活体，有效防止屏幕二次翻拍等作弊攻击，支持单张或多张判断逻辑。
灵活支持RGB摄像头设备的实时活体检测，可有效防止翻拍、头模、打印图片等样本攻击。
简单易用：可直接调用的API接口，服务简单易用，易被集成，兼容性强。

输入限制

图像格式：PNG、JPG、JPEG、BMP、GIF、WEBP。
图像大小：不超过10 MB。如您有大图需求，请通过钉钉群（23109592）联系我们。
图像分辨率：建议大于256×256像素，像素过低可能会影响识别效果。
URL地址中不能包含中文字符。

检测说明

最长检测时间是5秒，如果在该时间内没有完成检测，系统会强制返回超时错误码。
图像下载时间限制为3秒，如果下载时间超过3秒，系统会返回下载超时。
图像检测接口响应时间依赖图像的下载时间。请保证被检测图像所在的存储服务稳定可靠，建议您使用阿里云OSS存储或者CDN缓存。
最多可检测10张图像。

实战测试

可以看出这个活体检测效果很出众，可以快速把真人直照和翻照（照片、卡通等）识别出来

1.高精度防伪、尊重隐私、高灵敏拦截、简单易用

2.人脸活体检测功能使用起来非常简单，尤其是api调用方式很简单，而且使用文档写的也很详细

1.3 智能美肤

功能描述

智能美肤功能可实现输入一张人物图像，自动对脸部以及全身皮肤进行美肤，同时尽可能的保留皮肤质感。功能支持情况如下：

脸部美肤：脸部区域匀肤、去瑕疵，比如：痘、痘印、雀斑等。
全身皮肤：全身皮肤区域美白。
多人照片：支持不超过10人的多人图片处理。

应用场景

专业修图：可用于影楼、电商、图片直播等专业摄影场景，利用智能美肤算法快速进行美肤修图，提高工作效率。
美颜拍摄：用于娱乐、生活等场景，提高人物美观度。

特色优势

保留皮肤质感：使用深度学习算法，实现精准美肤，皮肤光滑有质感。
保持背景稳定：仅对裸露的皮肤区域进行修饰，不影响背景区域。
支持多人美肤：支持单张图像中多人的美肤。

效果展示：

可以看出美颜效果很不错！

1.4 更多功能简介：

人脸属性识别

检测授权图像中信息，输出人脸数量，概率、性别、年龄、表情（中性/微笑）、是否戴眼镜、是否佩戴口罩等多种属性，实现高性能的属性识别。

动作行为识别

判断输入授权图片的人体动作行为，当前可以识别的行为类别包括：举手、吃喝、吸烟、打电话、玩手机、趴桌睡觉、跌倒等动作。

更多有趣功能自行尝试

2.阿里视觉智能开放平台其他开放能力

2.1 概况预览

参考文档：https://help.aliyun.com/document_detail/155007.html?spm=a2c4g.11186623.0.0.33a45487V5u43t

2.1文字识别

2.1.1 表格识别

自动识别表格位置、表格内容信息，适用于黑色的，横线、竖线都齐全的表格中内容识别。

2.1.2 PDF识别

整体看到效果很不错

文章标签：

视觉智能开放平台

文字识别

计算机视觉

编解码

机器学习/深度学习

文字识别

人工智能

安全

API

算法

缓存

存储

关键词：

AI服务

AI检测

AI智能

AI开发

AI服务开发

汀丶人工智能

目录

相关文章

阿里云云原生

|

9月前

|

人工智能安全 API

20 万奖金池就位！Higress AI 网关开发挑战赛参赛指南

本次赛事共设三大赛题方向，参赛者可以任选一个方向参赛。本文是对每个赛题方向的参赛指南。

阿里云云原生

687 71 103

阿里云云原生

|

9月前

|

人工智能运维安全

加速智能体开发：从 Serverless 运行时到 Serverless AI 运行时

在云计算与人工智能深度融合的背景下，Serverless 技术作为云原生架构的集大成者，正加速向 AI 原生架构演进。阿里云函数计算（FC）率先提出并实践“Serverless AI 运行时”概念，通过技术创新与生态联动，为智能体（Agent）开发提供高效、安全、低成本的基础设施支持。本文从技术演进路径、核心能力及未来展望三方面解析 Serverless AI 的突破性价值。

阿里云云原生

877 4 4

阿里云云原生

|

9月前

|

人工智能运维 Java

Spring AI Alibaba Admin 开源！以数据为中心的 Agent 开发平台

Spring AI Alibaba Admin 正式发布！一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测，助力企业高效构建可信赖的 AI Agent 应用。开源共建，现已上线！

阿里云云原生

8278 122 159

阿里云开发者

|

人工智能自然语言处理前端开发

产品经理也能“开发”需求？淘宝信息流从需求到上线的AI端到端实践

淘宝推荐信息流业务，常年被“需求多、技术栈杂、协作慢”困扰，需求上线周期动辄一周。WaterFlow——一套 AI 驱动的端到端开发新实践，让部分需求两天内上线，甚至产品经理也能“自产自销”需求。短短数月，已落地 30+ 需求、自动生成 5.4 万行代码，大幅提升研发效率。接下来，我们将揭秘它是如何落地并改变协作模式的。

阿里云开发者

1470 37 37

产品经理也能“开发”需求？淘宝信息流从需求到上线的AI端到端实践

阿里云开发者

|

9月前

|

人工智能 IDE 开发工具

从6人日到1人日：一次AI驱动的客户端需求开发实战

从6人日到1人日：一次AI驱动的客户端需求开发实战

阿里云开发者

544 3 3

从6人日到1人日：一次AI驱动的客户端需求开发实战

赣州云智科技的技术铺子

|

9月前

|

人工智能小程序开发者

【一步步开发AI运动APP】十二、自定义扩展新运动项目03

继【一步步开发AI运动小程序】后，我们推出新系列【一步步开发AI运动APP】，助开发者打造高性能、优体验的AI运动应用。本文详解自定义扩展运动分析器的统一管理实现，提升代码复用性与可维护性，涵盖APP与小程序插件差异及完整代码示例，助力AI运动场景深度拓展。

赣州云智科技的技术铺子

261 4 4

556AI

|

9月前

|

人工智能 Java 测试技术

【556AI】（一）IntelliJ IDEA全流程AI设计开发平台

556AI支持IDEA、PHPSTORM、PYCHARM最新版 AI平台定位是开发大型软件项目，大型软件项目代码AI生成引擎，OA/ERP/MES 百万行代码一次性AI生成支持axure原型导入预览，集成AI软件设计/AI软件开发/AI软件测试整个流程支持若依 JEECG SmartAdmin THINKPHP Django等多种JAVA/PHP/python框架实现了java php python 的统一增强行调试方式可以链接多个AI大模型，进行AI生成代码

556AI

1032 8 8

中杯可乐多加冰

|

9月前

|

人工智能自然语言处理数据可视化

smardaten AI + 无代码开发实践：基于自然语言交互快速开发【苏超赛事管理系统】

苏超赛事管理系统基于smardaten无代码平台，通过AI生成与可视化配置，实现球队、赛程、积分等全流程数字化管理，提升效率、优化体验、支持数据可视化，助力赛事高效运营。

中杯可乐多加冰

355 0 0

smardaten AI + 无代码开发实践：基于自然语言交互快速开发【苏超赛事管理系统】

basu2023

|

9月前

|

人工智能 Cloud Native 自然语言处理

拔俗AI智能体服务开发：你的7x24小时数字员工，让企业效率飙升的秘密武器

在“人效为王”时代，企业面临服务响应慢、成本高、协同难等痛点。阿里云AI智能体以自主决策、多模态交互、持续学习三大引擎，打造永不疲倦的“数字员工”，实现7×24小时高效服务，助力企业降本增效、驱动创新增长。（238字）

basu2023

638 0 0

赣州云智科技的技术铺子

|

9月前

|

人工智能小程序搜索推荐

【一步步开发AI运动APP】十二、自定义扩展新运动项目2

本文介绍如何基于uni-app运动识别插件实现“双手并举”自定义扩展运动，涵盖动作拆解、姿态检测规则构建及运动分析器代码实现，助力开发者打造个性化AI运动APP。

赣州云智科技的技术铺子

360 0 0

视觉智能

人脸人体

热门文章

最新文章

阿里视觉智能开放平台（灵杰AI开放服务）【评测】人脸活体检测、智能美肤、文字识别等功能很多等待你的开发

Mediapipe三维实时人体关键点检测与追踪（一）

【阿里云OpenVI-人脸感知理解系列之人脸识别】基于Transformer的人脸识别新框架TransFace ICCV-2023论文深入解读

【OpenVI—论文解读系列】ICLR 2023 | 开源轻量人脸检测DamoFD

基于深度学习的人脸识别与管理系统（UI界面增强版，Python代码）

人脸识别系统技术方案

LabVIEW快速实现OpenCV DNN（YunNet）的人脸检测(含源码)

【OpenVI—论文解读系列】ICML long talk | 开源半监督学习框架Dash

【一步步开发AI运动小程序】十七、如何识别用户上传视频中的人体、运动、动作、姿态？

【视觉智能AI场景解决方案——智慧考勤】

【一步步开发AI运动小程序】十七、如何识别用户上传视频中的人体、运动、动作、姿态？

uni-app开发AI康复锻炼小程序，帮助肢体受伤患者康复！

【一步步开发AI运动小程序】十六、AI运动识别中，如何判断人体站位？

纯Go语言开发人脸检测、瞳孔/眼睛定位与面部特征检测插件-助力GoFly快速开发框架

【一步步开发AI运动小程序】六、人体骨骼图绘制

【一步步开发AI运动小程序】七、进行运动计时、计数

拿下奇怪的前端报错（六）：多摄手机webrtc拉取视频流会导致应用崩溃，从而无法进行人像扫描

【视觉智能产品速递——人物动漫化能力上新】

FaceChain应用生态爆发？无限可能的人物应用等你加入探索！

智慧校园-建设篇——开放视觉AI场景解决方案

相关产品

视觉智能开放平台

文档详情产品详情

相关课程

更多

AI人像动漫画实操教学

视觉AI技术体系及趋势概述

AIGC无处不在，把AI应用构建于Serverless之上

【科技少年】AI领航员探索教程（赛前训练）

达摩院视觉AI精品课

AI开发者的Docker实践

相关电子书

更多

AI 原生应用开源开发者沙龙·上海站电子书

AI原生应用开发实战营—Serverless AI专场·北京

阿里云 AI 原生应用开发实战营

相关实验场景

更多

使用AI容器镜像部署Qwen大语言模型

【玩转ComfyUI】基于函数计算一键部署AI生图平台ComfyUI

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！