阿里云视觉智能开放平台正式上线,阿里集团核心视觉AI能力对外开放

本文涉及的产品
视觉智能开放平台,分割抠图1万点
票证核验,票证核验 50次/账号
OCR统一识别,每月200次
简介:

1月底,阿里云正式推出以计算机视觉AI能力为核心的视觉智能开放平台(vision.aliyun.com),平台目前已上线8大类目,超过50多种视觉AI能力,面向人脸识别,文字识别,商品理解,内容安全,图像识别,图像增强,目标检测等多个视觉应用核心场景。所有视觉AI能力都以API方式进行开放,最大程度降低开发者接入成本。

阿里云作为亚洲最大的公有云服务商,支撑起了国内最大的零售平台淘宝,天猫,最大的支付平台支付宝,背后得益于雄厚的技术研发能力和运维能力。视觉技术作为AI领域应用最广泛的技术之一,在阿里巴巴内部一直作为核心技术不停的进行研发创新,最终形成了成熟的视觉体系。今天,阿里这些所有成熟的视觉AI都能在阿里云视觉智能平台调用(vision.aliyun.com)

据了解,阿里云视觉智能平台上所有AI能力均来自阿里巴巴经济体,包括达摩院、阿里云、支付宝、菜鸟、天猫等事业部,其中包含了深度学习、图像识别、OCR,图计算等方面的最新前沿研究成果,并且所有AI能力都经过了阿里经济体的具体应用与实践,确保各能力符合场景实际需求。

平台特点

阿里云视觉智能平台荟聚了阿里巴巴集团最专业、全面、易用的视觉AI能力,同时还提供最快捷有效的方式为开发者提供服务,降低开发者研发成本,降低使用门槛,让小白也能使用人工智能。
01.jpg

平台能力

平台已经上线超过50种AI能力,涵盖8大类目视觉智能能力,以满足开发者在安防、数字营销、新零售、生活娱乐等方面的功能开发需求。还有100+AI能力在陆续上新中。具体能力如下所示:

人脸识别:人脸数量检测,人脸特征点检测,人脸定位检测,人脸置信度检测,人脸姿态检测,人脸特征点定位检测,瞳孔检测,性别识别,年龄识别,简单表情识别,佩戴眼镜识别,人脸属性识别,人脸对比1:1,人脸对比1:N

文字识别:身份证识别,户口页识别,银行卡识别,名片识别,驾驶证识别,行驶证识别,车牌识别,VIN码识别,出租车发票识别,火车票识别,营业执照识别,公章识别,通用文字识别,表格识别

商品理解:商品分类

内容安全:图片智能鉴黄,图片暴恐涉政识别,图片logo识别,图片垃圾广告识别,图片不良场景识别,图片风险人物识别

图像识别:颜色识别,风格识别,元素识别,通用图像打标,场景识别

图像增强:图像裁切,图像超分,色彩迁移,风格迁移

图像分割:通用分割,人像分割,面部分割,头部分割,头发分割,商品分割

目标检测:主题检测,机动车检

效率平台

视觉智能领域能力技术相比其它AI类技术(语音语言等),功能流派更多,场景也更复杂 ,各种能力逻辑也存在互相包含的情况。阿里云视觉智能平台依靠整个阿里巴巴经济体的大量业务场景和应用实践(电商零售、金融物流、文娱营销、企业服务等多个行业),将复杂的视觉AI能力进行系统划分,形成最符合实践场景的AI能力系统,并通过平台进行统一输出,开发者可以轻松找到适用于自身研发需求和业务场景的能力,以最低的成本调用最匹配的AI能力进行视觉场景研发。
02.png

普惠三面

“使用门槛越来越低“
“使用人群越来越多“
“使用面越来越广“
阿里云视觉智能平台希望为视觉智能AI领域带来真正的普惠AI,将接入使用视觉AI门槛和成本降到最低,以整个阿里云最强的运维能力和技术为用户提供最高的价值。未来,阿里云视觉智能将集合更多视觉领域的AI能力,拓展更多成熟的使用场景,在图像识别,人脸识别,文字识别等视觉智能领域帮助开发者和企业实现研发为核心,创造为价值的普惠AI。

了解更多AI产品请戳https://vision.aliyun.com/
点击观看产品发布会https://developer.aliyun.com/live/1915
03.jpg

相关文章
|
3天前
|
人工智能 自然语言处理 搜索推荐
阿里云 AI 搜索开放平台新功能发布:大模型联网能力上线
阿里云 AI 搜索开放平台此次新增了大模型联网能力,通过集成大语言模型(LLM)和联网搜索技术,为用户提供更智能、更全面的搜索体验。
146 25
|
30天前
|
设计模式 人工智能 API
Cursor 上线最新 AI 模型 Claude 3.7 Max:200k上下文+200次工具调用!史上最强代码助手硬核上线
Claude 3.7 Max 是 Cursor 推出的最新 AI 模型,支持 200k 上下文窗口和 200 次工具调用,专为复杂代码任务设计,适合硬核开发者和大型项目。
209 6
Cursor 上线最新 AI 模型 Claude 3.7 Max:200k上下文+200次工具调用!史上最强代码助手硬核上线
|
1月前
|
人工智能 并行计算 语音技术
Open-LLM-VTuber:宅男福音!开源AI老婆离线版上线,实时语音+Live2D互动还会脸红心跳
Open-LLM-VTuber 是一个开源的跨平台语音交互 AI 伴侣项目,支持实时语音对话、视觉感知和生动的 Live2D 动态形象,完全离线运行,保护用户隐私。
199 10
Open-LLM-VTuber:宅男福音!开源AI老婆离线版上线,实时语音+Live2D互动还会脸红心跳
|
1月前
|
人工智能 自然语言处理 API
MM-StoryAgent:交大阿里联合开源!多模态AI一键生成儿童故事绘本+配音
MM-StoryAgent 是上海交通大学与阿里巴巴联合推出的开源多模态、多智能体框架,用于生成沉浸式的有声故事绘本视频,支持文本、图像、语音等多种模态的生成与对齐。
131 7
MM-StoryAgent:交大阿里联合开源!多模态AI一键生成儿童故事绘本+配音
|
1月前
|
机器学习/深度学习 人工智能 算法
PRefLexOR:MIT自进化AI框架上线!动态知识图谱+跨域推理,重塑自主思考
PRefLexOR 是 MIT 团队推出的新型自学习 AI 框架,结合偏好优化和强化学习,通过递归推理和多步反思,动态生成知识图谱,支持跨领域推理和自主学习。
148 3
PRefLexOR:MIT自进化AI框架上线!动态知识图谱+跨域推理,重塑自主思考
|
1月前
|
人工智能 自然语言处理 程序员
AI 程序员上线,一个全新的时代就要来了
随着生成式AI技术的发展,编程领域迎来了新的变革。英伟达CEO黄仁勋曾表示未来编程可交由AI完成,引发热议。然而,AI目前更多是作为程序员的助手存在。阿里云的“通义灵码”已在国内某互联网大厂上岗,担任代码助理角色,好评率超80%。它能7x24小时辅助编写、调试、优化代码,大幅提高开发效率。宏哥在视频中展示了其根据上下文续写代码及智能排查异常报错的能力,感兴趣的可以自行体验。
236 6
|
1月前
|
人工智能 运维 文字识别
新书上线 |《零门槛AIGC应用实战——Serverless+AI 轻松玩转高频AIGC场景》免费下载
新书上线 |《零门槛AIGC应用实战——Serverless+AI 轻松玩转高频AIGC场景》免费下载
|
3天前
|
人工智能 开发框架 安全
Serverless MCP 运行时业界首发,函数计算让 AI 应用最后一公里提速
作为云上托管 MCP 服务的最佳运行时,函数计算 FC 为阿里云百炼 MCP 提供弹性调用能力,用户只需提交 npx 命令即可“零改造”将开源 MCP Server 部署到云上,函数计算 FC 会准备好计算资源,并以弹性、可靠的方式运行 MCP 服务,按实际调用时长和次数计费,欢迎你在阿里云百炼和函数计算 FC 上体验 MCP 服务。
|
19天前
|
人工智能 数据可视化 API
36.7K star!拖拽构建AI流程,这个开源LLM应用框架绝了!
`Flowise` 是一款革命性的低代码LLM应用构建工具,开发者通过可视化拖拽界面,就能快速搭建基于大语言模型的智能工作流。该项目在GitHub上线不到1年就斩获**36.7K星标**,被开发者誉为"AI时代的乐高积木"。
113 8
|
17天前
|
人工智能 API 计算机视觉
AI-ClothingTryOn:服装店老板连夜下架试衣间!基于Gemini开发的AI试衣应用,一键生成10种穿搭效果
AI-ClothingTryOn是基于Google Gemini技术的虚拟试衣应用,支持人物与服装照片智能合成,可生成多达10种试穿效果版本,并提供自定义提示词优化功能。
135 17
AI-ClothingTryOn:服装店老板连夜下架试衣间!基于Gemini开发的AI试衣应用,一键生成10种穿搭效果

热门文章

最新文章