阿里云首推免费人脸识别SDK 让每个APP轻松拥有短视频AR特效

简介: 早在今年五月,阿里云已经推出了短视频解决方案。近日,阿里云再次率先颠覆行业,在业内首推免费的人脸识别SDK,结合其原有的短视频能力,大大降低了人脸识别+AR特效+短视频的入行门槛。

早在今年五月,阿里云已经推出了短视频解决方案。近日,阿里云再次率先颠覆行业,在业内首推免费的人脸识别SDK,结合其原有的短视频能力,大大降低了人脸识别+AR特效+短视频的入行门槛。

你所知道的人脸识别行业

提到人脸识别,大家会联想到商业支付、身份识别、广告投放、人机交互、系统公安等等众多生活场景。虽然这项技术的研究始于20世纪60年代,但是在近年这个课题才愈发活跃。以日常生活中比较常见的场景——社交互动为例,通过人脸识别、AR特效、动图元素的支持,可以帮助用户打破社交壁垒,更立体化、个性化、趣味化的表达自我和分享生活点滴。

市面上已经有的人脸识别SDK多数费用高昂,动辄几十万,而某些厂商号称免费,其实也是基于网络API的调用,并不适合在移动端录制短视频时使用,也就无法应用在社交场景之中。这让很多想在APP中添加短视频AR特效的团队望尘莫及。

阿里云联合手淘 推出人脸识别免费SDK

阿里云通过整合集团资源,将手淘团队自研的人脸识别SDK和阿里云短视频SDK深度融合,真正做到了不依赖于网络API的实时检测、识别、跟踪。

目前,官网上的专业版短视频SDK已经拥有了手淘自研的人脸识别功能,实现了人脸识别+AR动态贴纸的完整体验,结合原有的短视频采集、导入裁剪、编辑、合成、极速上传、媒资管理、视频转码、分发加速、播放等全链路能力,阿里云可以为创业者们提供一站式解决方案,让每个APP轻松实现短视频AR新玩法。

_2017_09_26_12_46_12

关键技术介绍及算法性能测速

我们来看看具体的应用场景和技术是怎样的,用户在客户端进入拍摄画面后,可以自行选择搭配动态贴纸等个性化素材,实现AR特效,使短视频打造出科幻、卖萌、恶搞等不同的效果。其中主要涉及到的是人脸检测、关键点定位、追踪等核心技术。

第一, 人脸的检测是用于定位视频中的人脸,同时检测多张人脸和处理多角度、部分遮挡人脸等复杂情况也在这一步妥善处理,从而快速、准确的找到人脸。

第二, 人脸的关键点定位,则是用于已知人脸所在位置的基础上,自动标注人脸的轮廓、五官位置,比如眼睛、鼻子、嘴巴、眉毛、耳朵等关键位置。阿里云提供人脸识别关键点个数多达68个,可以更准确的追踪五官,保证用户的体验。

第三, AR特效美化,根据已知的关键点位置,搭配上用户所选的动态贴纸,并根据捕捉不同的面部动作来变换AR特效,达到真实互动。

第四, 人脸追踪,视频是动态而非静止的,当用户脸部移动、转动时,阿里云SDK可以实现对关键点的追踪,可识别姿态范围为yaw±60°,pitch±45°,roll±45°,精准的捕捉动作,持续追踪动态贴纸和AR特效。

阿里云人脸识别SDK具有准确度高的特性,通过68个关键点检测和以上技术,实现平均错误率低于 5%,出现“对不上”这种尴尬场面的概率极低。据悉,阿里云未来也会推出商业版人脸识别的高级功能,满足更高级客户的需求。

在性能方面,阿里云人脸识别算法和其它厂商算法在测速上的区别如下:
_
注:以上测试480p的最小人脸尺寸为4848(px);720p的最小人脸尺寸为7272

从上表可以看出,本人脸识别算法在同样机型、同等测试对象的条件下,测速表现大幅优于业内友商。经过阿里云集团手淘亿级日活跃用户产品的考验,性能方面毋庸置疑。由于该算法也应用于手淘相关业务之中,所以后续的迭代、维护都会有强有力的保障。

阿里云人脸识别SDK的免费开放,给短视频行业带来了无限的可能性。基于阿里云,创业者和用户们都有了更多新鲜的玩法,创新机遇随之而来,希望整个行业能产生更多元、更深入的探索。

扫码体验DEMO
_2017_09_27_8_58_10

目录
相关文章
|
26天前
|
程序员 开发工具 Android开发
Android|使用阿里云推流 SDK 实现双路推流不同画面
本文记录了一种使用没有原生支持多路推流的阿里云推流 Android SDK,实现同时推送两路不同画面的流的方法。
46 7
|
2月前
|
开发工具
uniapp, 短剧视频类App实现参考,支持滑动播放,仿抖音 仿陌陌 短视频 无限滑动播放 视频流
阿里云点播服务web播放器sdk,短剧视频类App实现参考。仿抖音 仿陌陌 短视频 无限滑动播放 视频流。无uniapp video 原生组件的层级、遮挡、覆盖问题,适合与不同功能视图组合使用,实现丰富的应用功能。
uniapp, 短剧视频类App实现参考,支持滑动播放,仿抖音 仿陌陌 短视频 无限滑动播放 视频流
|
5月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之uniapp框架如何使用阿里云金融级人脸识别
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
137 0
|
3月前
|
Java 开发工具
通过Java SDK调用阿里云模型服务
在阿里云平台上,可以通过创建应用并使用模型服务完成特定任务,如生成文章内容。本示例展示了一段简化的Java代码,演示了如何调用阿里云模型服务生成关于“春秋战国经济与文化”的简短文章。示例代码通过设置系统角色为历史学家,并提出文章生成需求,最终处理并输出生成的文章内容。在实际部署前,请确保正确配置环境变量中的密钥和ID,并根据需要调整SDK导入语句及类名。更多详情和示例,请参考相关链接。
|
3月前
|
存储 监控 API
视觉智能开放平台产品使用合集之人脸识别服务端的离线SDK是什么
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
33 0
|
4月前
|
消息中间件 分布式计算 DataWorks
DataWorks产品使用合集之如何使用Python和阿里云SDK读取OSS中的文件
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
5月前
|
网络协议 安全 调度
阿里云公共DNS发布支持鸿蒙系统版的SDK
阿里云公共DNS发布支持鸿蒙系统版SDK,赋能鸿蒙开发者快速接入阿里云公共DNS服务。公共DNS将帮助接入的鸿蒙应用免除LocalDNS劫持困扰、解析加速、精准调度。
|
5月前
|
算法 小程序 开发工具
视觉智能开放平台操作报错合集之同样的图片路径(上海阿里云),sdk报错code.400,是什么原因
在使用视觉智能开放平台时,可能会遇到各种错误和问题。虽然具体的错误代码和消息会因平台而异,但以下是一些常见错误类型及其可能的原因和解决策略的概述,包括但不限于:1. 认证错误、2. 请求参数错误、3. 资源超限、4. 图像质量问题、5. 服务不可用、6. 模型不支持的场景、7. 网络连接问题,这有助于快速定位和解决问题。
|
5月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之人脸识别离线SDK支持离线识别吗
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
1月前
|
JSON 小程序 JavaScript
uni-app开发微信小程序的报错[渲染层错误]排查及解决
uni-app开发微信小程序的报错[渲染层错误]排查及解决
500 7
下一篇
无影云桌面