阿里云视觉智能开放平台正式上线,阿里集团核心视觉AI能力对外开放

本文涉及的产品
通用文字识别,通用文字识别 200次/月
车辆物流识别,车辆物流识别 200次/月
自定义KV模板,自定义KV模板 500次/账号
简介:

1月底,阿里云正式推出以计算机视觉AI能力为核心的视觉智能开放平台(vision.aliyun.com),平台目前已上线8大类目,超过50多种视觉AI能力,面向人脸识别,文字识别,商品理解,内容安全,图像识别,图像增强,目标检测等多个视觉应用核心场景。所有视觉AI能力都以API方式进行开放,最大程度降低开发者接入成本。

阿里云作为亚洲最大的公有云服务商,支撑起了国内最大的零售平台淘宝,天猫,最大的支付平台支付宝,背后得益于雄厚的技术研发能力和运维能力。视觉技术作为AI领域应用最广泛的技术之一,在阿里巴巴内部一直作为核心技术不停的进行研发创新,最终形成了成熟的视觉体系。今天,阿里这些所有成熟的视觉AI都能在阿里云视觉智能平台调用(vision.aliyun.com)

据了解,阿里云视觉智能平台上所有AI能力均来自阿里巴巴经济体,包括达摩院、阿里云、支付宝、菜鸟、天猫等事业部,其中包含了深度学习、图像识别、OCR,图计算等方面的最新前沿研究成果,并且所有AI能力都经过了阿里经济体的具体应用与实践,确保各能力符合场景实际需求。

平台特点

阿里云视觉智能平台荟聚了阿里巴巴集团最专业、全面、易用的视觉AI能力,同时还提供最快捷有效的方式为开发者提供服务,降低开发者研发成本,降低使用门槛,让小白也能使用人工智能。
01.jpg

平台能力

平台已经上线超过50种AI能力,涵盖8大类目视觉智能能力,以满足开发者在安防、数字营销、新零售、生活娱乐等方面的功能开发需求。还有100+AI能力在陆续上新中。具体能力如下所示:

人脸识别:人脸数量检测,人脸特征点检测,人脸定位检测,人脸置信度检测,人脸姿态检测,人脸特征点定位检测,瞳孔检测,性别识别,年龄识别,简单表情识别,佩戴眼镜识别,人脸属性识别,人脸对比1:1,人脸对比1:N

文字识别:身份证识别,户口页识别,银行卡识别,名片识别,驾驶证识别,行驶证识别,车牌识别,VIN码识别,出租车发票识别,火车票识别,营业执照识别,公章识别,通用文字识别,表格识别

商品理解:商品分类

内容安全:图片智能鉴黄,图片暴恐涉政识别,图片logo识别,图片垃圾广告识别,图片不良场景识别,图片风险人物识别

图像识别:颜色识别,风格识别,元素识别,通用图像打标,场景识别

图像增强:图像裁切,图像超分,色彩迁移,风格迁移

图像分割:通用分割,人像分割,面部分割,头部分割,头发分割,商品分割

目标检测:主题检测,机动车检

效率平台

视觉智能领域能力技术相比其它AI类技术(语音语言等),功能流派更多,场景也更复杂 ,各种能力逻辑也存在互相包含的情况。阿里云视觉智能平台依靠整个阿里巴巴经济体的大量业务场景和应用实践(电商零售、金融物流、文娱营销、企业服务等多个行业),将复杂的视觉AI能力进行系统划分,形成最符合实践场景的AI能力系统,并通过平台进行统一输出,开发者可以轻松找到适用于自身研发需求和业务场景的能力,以最低的成本调用最匹配的AI能力进行视觉场景研发。
02.png

普惠三面

“使用门槛越来越低“
“使用人群越来越多“
“使用面越来越广“
阿里云视觉智能平台希望为视觉智能AI领域带来真正的普惠AI,将接入使用视觉AI门槛和成本降到最低,以整个阿里云最强的运维能力和技术为用户提供最高的价值。未来,阿里云视觉智能将集合更多视觉领域的AI能力,拓展更多成熟的使用场景,在图像识别,人脸识别,文字识别等视觉智能领域帮助开发者和企业实现研发为核心,创造为价值的普惠AI。

了解更多AI产品请戳https://vision.aliyun.com/
点击观看产品发布会https://developer.aliyun.com/live/1915
03.jpg

相关文章
|
4天前
|
人工智能 UED
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
VersaGen 是一款生成式 AI 代理,专注于文本到图像合成中的视觉控制能力,支持多种视觉控制类型,并通过优化策略提升图像生成质量和用户体验。
22 8
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
|
16天前
|
存储 人工智能 安全
从AI换脸到篡改图像,合合信息如何提升视觉内容安全?
从AI换脸到篡改图像,合合信息如何提升视觉内容安全?
从AI换脸到篡改图像,合合信息如何提升视觉内容安全?
|
10天前
|
人工智能 API 数据库
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
Browser Use 是一款专为大语言模型设计的智能浏览器工具,支持多标签页管理、视觉识别、内容提取等功能,并能记录和重复执行特定动作,适用于多种应用场景。
150 0
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
|
13天前
|
机器学习/深度学习 人工智能 安全
合合信息亮相CSIG AI可信论坛,全面拆解视觉内容安全的“终极防线”!
合合信息在CSIG AI可信论坛上,全面拆解了视觉内容安全的“终极防线”。面对AI伪造泛滥的问题,如Deepfake换脸、PS篡改等,合合信息展示了其前沿技术,包括通用PS检测系统和AIGC与换脸检测系统,有效应对视觉内容安全挑战。公司在国际赛事中屡获殊荣,并联合多方发布《文本图像篡改检测系统技术要求》,推动行业标准化发展。通过技术创新,合合信息为金融、政企等领域提供可靠保障,守护社会信任,引领视觉内容安全新方向。
30 0
|
3月前
|
人工智能 自动驾驶 搜索推荐
【通义】AI视界|苹果AI本周正式上线,将引入四大功能
本文由【通义】自动生成,涵盖苹果AI上线、特斯拉被华尔街重新评估、谷歌开发控制计算机的AI、Meta与路透社合作及Waymo获56亿美元融资等科技动态。点击链接或扫描二维码获取更多信息。
|
3月前
|
机器学习/深度学习 人工智能 算法
使用 NVIDIA TAO Toolkit 5.0 体验最新的视觉 AI 模型开发工作流程
NVIDIA TAO Toolkit 5.0 提供低代码框架,支持从新手到专家级别的用户快速开发视觉AI模型。新版本引入了开源架构、基于Transformer的预训练模型、AI辅助数据标注等功能,显著提升了模型开发效率和精度。TAO Toolkit 5.0 还支持多平台部署,包括GPU、CPU、MCU等,简化了模型训练和优化流程,适用于广泛的AI应用场景。
77 0
使用 NVIDIA TAO Toolkit 5.0 体验最新的视觉 AI 模型开发工作流程
|
8天前
|
机器学习/深度学习 人工智能 自动驾驶
企业内训|AI大模型在汽车行业的前沿应用研修-某汽车集团
本课程是TsingtaoAI为某汽车集团高级项目经理设计研发,课程全面系统地解析AI的发展历程、技术基础及其在汽车行业的深度应用。通过深入浅出的理论讲解、丰富的行业案例分析以及实战项目训练,学员将全面掌握机器学习、深度学习、NLP与CV等核心技术,了解自动驾驶、智能制造、车联网与智能营销等关键应用场景,洞悉AI技术对企业战略布局的深远影响。
140 97
|
13天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
12月14日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·湖南大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
CogAgent-9B 是智谱AI基于 GLM-4V-9B 训练的专用Agent任务模型,支持高分辨率图像处理和双语交互,能够预测并执行GUI操作,广泛应用于自动化任务。
39 12
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
|
1天前
|
机器学习/深度学习 人工智能 监控
AI在交通管理系统中的应用
AI在交通管理系统中的应用
31 23