阿里云视觉智能开放平台正式上线,阿里集团核心视觉AI能力对外开放

本文涉及的产品
个人证照识别,个人证照识别 200次/月
教育场景识别,教育场景识别 200次/月
视觉智能开放平台,图像资源包5000点
简介:

1月底,阿里云正式推出以计算机视觉AI能力为核心的视觉智能开放平台(vision.aliyun.com),平台目前已上线8大类目,超过50多种视觉AI能力,面向人脸识别,文字识别,商品理解,内容安全,图像识别,图像增强,目标检测等多个视觉应用核心场景。所有视觉AI能力都以API方式进行开放,最大程度降低开发者接入成本。

阿里云作为亚洲最大的公有云服务商,支撑起了国内最大的零售平台淘宝,天猫,最大的支付平台支付宝,背后得益于雄厚的技术研发能力和运维能力。视觉技术作为AI领域应用最广泛的技术之一,在阿里巴巴内部一直作为核心技术不停的进行研发创新,最终形成了成熟的视觉体系。今天,阿里这些所有成熟的视觉AI都能在阿里云视觉智能平台调用(vision.aliyun.com)

据了解,阿里云视觉智能平台上所有AI能力均来自阿里巴巴经济体,包括达摩院、阿里云、支付宝、菜鸟、天猫等事业部,其中包含了深度学习、图像识别、OCR,图计算等方面的最新前沿研究成果,并且所有AI能力都经过了阿里经济体的具体应用与实践,确保各能力符合场景实际需求。

平台特点

阿里云视觉智能平台荟聚了阿里巴巴集团最专业、全面、易用的视觉AI能力,同时还提供最快捷有效的方式为开发者提供服务,降低开发者研发成本,降低使用门槛,让小白也能使用人工智能。
01.jpg

平台能力

平台已经上线超过50种AI能力,涵盖8大类目视觉智能能力,以满足开发者在安防、数字营销、新零售、生活娱乐等方面的功能开发需求。还有100+AI能力在陆续上新中。具体能力如下所示:

人脸识别:人脸数量检测,人脸特征点检测,人脸定位检测,人脸置信度检测,人脸姿态检测,人脸特征点定位检测,瞳孔检测,性别识别,年龄识别,简单表情识别,佩戴眼镜识别,人脸属性识别,人脸对比1:1,人脸对比1:N

文字识别:身份证识别,户口页识别,银行卡识别,名片识别,驾驶证识别,行驶证识别,车牌识别,VIN码识别,出租车发票识别,火车票识别,营业执照识别,公章识别,通用文字识别,表格识别

商品理解:商品分类

内容安全:图片智能鉴黄,图片暴恐涉政识别,图片logo识别,图片垃圾广告识别,图片不良场景识别,图片风险人物识别

图像识别:颜色识别,风格识别,元素识别,通用图像打标,场景识别

图像增强:图像裁切,图像超分,色彩迁移,风格迁移

图像分割:通用分割,人像分割,面部分割,头部分割,头发分割,商品分割

目标检测:主题检测,机动车检

效率平台

视觉智能领域能力技术相比其它AI类技术(语音语言等),功能流派更多,场景也更复杂 ,各种能力逻辑也存在互相包含的情况。阿里云视觉智能平台依靠整个阿里巴巴经济体的大量业务场景和应用实践(电商零售、金融物流、文娱营销、企业服务等多个行业),将复杂的视觉AI能力进行系统划分,形成最符合实践场景的AI能力系统,并通过平台进行统一输出,开发者可以轻松找到适用于自身研发需求和业务场景的能力,以最低的成本调用最匹配的AI能力进行视觉场景研发。
02.png

普惠三面

“使用门槛越来越低“
“使用人群越来越多“
“使用面越来越广“
阿里云视觉智能平台希望为视觉智能AI领域带来真正的普惠AI,将接入使用视觉AI门槛和成本降到最低,以整个阿里云最强的运维能力和技术为用户提供最高的价值。未来,阿里云视觉智能将集合更多视觉领域的AI能力,拓展更多成熟的使用场景,在图像识别,人脸识别,文字识别等视觉智能领域帮助开发者和企业实现研发为核心,创造为价值的普惠AI。

了解更多AI产品请戳https://vision.aliyun.com/
点击观看产品发布会https://developer.aliyun.com/live/1915
03.jpg

相关文章
|
8天前
|
人工智能 缓存 Ubuntu
AI+树莓派=阿里P8技术专家。模拟面试、学技术真的太香了 | 手把手教学
本课程由阿里P8技术专家分享,介绍如何使用树莓派和阿里云服务构建AI面试助手。通过模拟面试场景,讲解了Java中`==`与`equals`的区别,并演示了从硬件搭建、语音识别、AI Agent配置到代码实现的完整流程。项目利用树莓派作为核心,结合阿里云的实时语音识别、AI Agent和文字转语音服务,实现了一个能够回答面试问题的智能玩偶。课程展示了AI应用的简易构建过程,适合初学者学习和实践。
63 22
|
22天前
|
人工智能 开发框架 算法
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
Qwen-Agent 是阿里通义开源的一个基于 Qwen 模型的 Agent 应用开发框架,支持指令遵循、工具使用、规划和记忆能力,适用于构建复杂的智能代理应用。
340 10
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
|
12天前
|
人工智能 API 开发者
阿里CEO吴泳铭-2024互联网大会发言:AI的最大价值是推动生产力变革
11月21日,2024年世界互联网大会“互联网企业家论坛”在乌镇召开。阿里巴巴CEO吴泳铭表示,AI的最大价值在于推动各行各业的生产力变革,而非仅限于开发超级APP。他强调,发展AI需建设繁荣的技术、产品和市场生态。目前,30多万家企业已接入阿里“通义”大模型,应用于代码开发、药物研发等场景。阿里巴巴坚持开源路线,全球开发者基于“通义千问”开发的衍生模型已突破7.8万个。吴泳铭认为,AI的发展需要行业共同努力,建设繁荣生态以实现高质量持续发展。
|
2月前
|
人工智能 自然语言处理 Swift
探索面向开放型问题的推理模型Marco-o1,阿里国际AI团队最新开源!
阿里国际AI团队发布的新模型Marco-o1,不仅擅长解决具有标准答案的学科问题(如代码、数学等),更强调开放式问题的解决方案。该模型采用超长CoT数据微调、MCTS扩展解空间等技术,提升了模型在翻译任务及复杂问题解决上的表现。研究团队还开源了部分数据和模型,供社区使用和进一步研究。
探索面向开放型问题的推理模型Marco-o1,阿里国际AI团队最新开源!
|
6天前
|
人工智能 运维 物联网
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。
|
2天前
|
人工智能 算法 前端开发
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
OmAgent 是 Om AI 与浙江大学联合开源的多模态语言代理框架,支持多设备连接、高效模型集成,助力开发者快速构建复杂的多模态代理应用。
95 72
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
|
14天前
|
机器学习/深度学习 人工智能 算法
AI在体育分析与预测中的深度应用:变革体育界的智能力量
AI在体育分析与预测中的深度应用:变革体育界的智能力量
80 31
|
10天前
|
人工智能 运维 负载均衡
智能运维新时代:AI在云资源管理中的应用与实践
智能运维新时代:AI在云资源管理中的应用与实践
90 23
|
17天前
|
机器学习/深度学习 人工智能 监控
AI在交通管理系统中的应用
AI在交通管理系统中的应用
69 23
|
5天前
|
人工智能 缓存 安全
每一个大模型应用都需要一个 AI 网关|场景和能力
本次分享的主题是每一个大模型应用都需要一个 AI 网关|场景和能力。由 API 网关产品经理张裕(子丑)进行分享。主要分为三个部分: 1. 企业应用 AI 场景面临的挑战 2. AI 网关的产品方案 3. AI 网关的场景演示

热门文章

最新文章