公告:人脸,文字识别,分割抠图离线SDK正式上线

本文涉及的产品
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,分割抠图1万点
简介: 阿里云视觉智能开放平台正式开放了离线SDK的下载,可部署在Android,iOS,Windows,Osx等系统,并且支持根据上层业务需求进行定制开发,完全离网,欢迎使用~

一、离线SDK介绍

阿里云视觉智能开放平台正式开放了离线SDK的下载,可完全在无网环境下工作,所有数据皆在设备本地运行处理,可根据业务需要进行灵活的上层业务开发。

 

开发下载离线SDK能力,

能力名称

支持终端

描述

实时视频分割

实时视频分割 SDK (Android)

基于深度学习框架,结合检测识别技术,实现高精视觉分割能力,可实现实时全自动主体、场景像素级识别,对高度镂空主体、复杂背景等场景都有较好的效果

实时视频分割 SDK (iOS)

实时视频分割 SDK (Windows)

实时视频分割 SDK Osx)

离线视频分割 SDKios

离线图片分割

离线图片分割 SDKAndroid

通过检测识别技术,对用户拍照或上传的图片进行精细化、无瑕疵的抠像处理,实现高精视觉分割能力,支持复杂图片背景的分割和替换。

离线图片分割 SDKios

实时无损分割

实时无损分割SDKWindows

通过颜色过滤和深度学习的融合技术,对直播中的视频进行实时分割,同时对边缘瑕疵进行边缘平滑和去杂色处理,实现影视级无瑕疵的实时视频分割效果。

实时无损分割SDK(Osx)

文字离线识别

证件识别SDKAndorid

支持身份证、驾驶证、行驶证正反面离线识别,可识别常用多个关键字段内容,识别精准度超过95%

证件识别SDK(ios)

车辆类识别SDKAndorid

支持扫描识别中国大陆所有单行车牌及VIN码的识别,支持以视频流形式的识别。

车辆类识别SDK(ios)

通用文字识别SDKAndorid

在离线环境下,支持在安卓或ios设备端实现通用文字、身份卡证、驾驶卡证和车牌的离线识别,包体很小、秒级识别速度。

通用文字识别SDK(ios)

 

离线SDK文档参考:

https://help.aliyun.com/document_detail/182962.html

 

欢迎访问阿里云视觉智能开放平台官网体验AI能力在线调试:https://vision.aliyun.com/

如果有问题可以加入我们的社区,有专家对接答疑,钉钉群:23109592

相关文章
|
12月前
|
达摩院 语音技术 开发工具
达摩院FunASR离线文件转写SDK发布,完成工业落地“最后一公里”
达摩院FunASR离线文件转写SDK发布,完成工业落地“最后一公里”
641 0
|
3月前
|
文字识别 API 开发工具
印刷文字识别产品使用合集之SDK支持ruby语言吗
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
2月前
|
文字识别 前端开发 Java
印刷文字识别使用问题之如何使用Python SDK来上传图片并获取识别结果
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
2月前
|
存储 人工智能 文字识别
印刷文字识别使用问题之离线识别车牌识别效果如何
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
3月前
|
API 开发工具 Android开发
视觉智能开放平台产品使用合集之离线SDK是否可以实现视频人脸对比搜索
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之人脸识别离线SDK支持离线识别吗
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
11月前
|
开发工具
视觉智能平台的美颜美型离线sdk,能完全离线吗
视觉智能平台的美颜美型离线sdk,能完全离线吗
64 1
|
4月前
|
存储 人工智能 文字识别
极空间 NAS 上线“AI 实验室”功能:自然语言搜图、以图搜图、文字识别
【2月更文挑战第17天】极空间 NAS 上线“AI 实验室”功能:自然语言搜图、以图搜图、文字识别
230 5
极空间 NAS 上线“AI 实验室”功能:自然语言搜图、以图搜图、文字识别
|
文字识别 API 语音技术
百度语音技术:文字识别转化为语音在线API和PHP-SDK开发文档的学习
百度语音技术:文字识别转化为语音在线API和PHP-SDK开发文档的学习
93 0
|
4月前
|
文字识别 JavaScript API
Vue实现:Ctrl+V粘贴文字图片截图,调用第三方API文字识别OCR内容并进行内容分割识别填充。
Vue实现:Ctrl+V粘贴文字图片截图,调用第三方API文字识别OCR内容并进行内容分割识别填充。
Vue实现:Ctrl+V粘贴文字图片截图,调用第三方API文字识别OCR内容并进行内容分割识别填充。