阿里巴巴的机器视觉有多强!ET城市大脑发布四大AI视觉产品

简介: 7月4日,阿里云ET城市大脑发布其第四款AI视觉产品“天擎”。阿里巴巴机器智能实验室副主任华先胜博士介绍,“天擎”可以用1分钟处理16小时的视频,处理分析速度惊人。除了“天擎”之外,ET城市大脑还有天曜、天鹰、天机三款AI视觉产品。

7月4日,阿里云ET城市大脑发布其第四款AI视觉产品“天擎”。阿里巴巴机器智能实验室副主任华先胜博士介绍,“天擎”可以用1分钟处理16小时的视频,处理分析速度惊人。

“摄像头”是ET城市大脑的眼睛,城市中有数以万计的摄像头,每天产出的海量视频数据不仅数量大,相当于1000亿张图片,一个人看完所有视频需要100年;而且难以理解,机器无法直接看懂,要先对视频信息作结构化处理,翻译成机器可以理解的二进制语言。

“天擎”就是ET城市大脑处理视频信息的发动机,负责把海量的视频图像信息在最短的时间内处理为二进制语言,从而为之后的车辆识别检测、行人识别检测提供基础。

除了“天擎”之外,ET城市大脑还有天曜、天鹰、天机三款AI视觉产品。

image

据媒体报道,杭州700多个道路断面已经接入“天曜”,24小时自动实时巡逻,对交通违章、交通事故等的报警反应速度在20秒内,准确率达95%以上。

image

“天鹰”能够快速识别车辆、行人,能够用于失踪人口、肇事车辆逃逸等场景。衢州城市大脑已经借助“天鹰”建立起了智能化安防体系。

“天机”则可以通过区域内的历史视频数据,预测未来的车辆、人流量,从而合理安排出警、人员接送车等,做好交通疏导,避免发生拥堵和安全问题。

据全球权威咨询与服务机构Forrester最近的报告,阿里云入选国内厂商机器视觉的最强阵营。以阿里云为代表,阿里巴巴的机器视觉能力不容小觑。

在去年的杭州云栖大会上,达摩院正式成立。在达摩院中,就有两位机器视觉的大牛人物:任小枫和华先胜。

任小枫在计算机视觉领域中对图像分类,物体识别、跟踪、检测,事件检测都有全面且深入的理解,华先胜是IEEE(国际电气与电子工程师协会)院士,视觉识别和搜索领域的国际级权威学者。

image

阿里巴巴机器智能实验室主任金榕(中)

阿里巴巴机器智能实验室副主任任小枫(左)、华先胜(右)

除此之外,成立8个月来达摩院获得了约20项国际顶级技术赛事第一,其中有多项和机器视觉有关。

image

例如,在机器视觉知名赛事Pascal VOC Comp4目标检测上夺得第一,可用于农作物检测,预防早期病虫害。

image

首次参加国际最大的自动驾驶计算机视觉算法集KITTI,将三项道路场景分割任务第一收入囊中。

image

世界知名行人再识别数据集Market1501首位命中率长期由达摩院占据第一。

除了这些国际技术赛事外,阿里巴巴的机器视觉还被用于肺结节诊断、电池片内部缺陷等实际问题。

成立达摩院之初,马云为达摩院设立了三项原则:第一达摩院必须比阿里巴巴生存得长久;其次,服务全世界至少20亿人口;第三,必须面向未来,其必须解决人类未来面临的问题和解决未来自立生存问题。

现在,阿里巴巴真的在不断探索新科技,令人钦佩!

相关文章
|
8天前
|
人工智能 安全
阿里巴巴 AI Coding 分享会 Qoder Together 杭州站诚邀你的参与!
Qoder Together ,不止技术分享,更是思维共振与灵感迸发。我们面向全球 AI Coding 爱好者,邀请 Qoder 团队、实战用户、AI Coding 探索者齐聚一堂,交流激发创意,碰撞拓展边界,重新定义智能编程未来。
101 0
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
204 10
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
|
1月前
|
人工智能 运维 监控
AI加持下的容器运维:别再当“背锅侠”,让机器帮你干活!
AI加持下的容器运维:别再当“背锅侠”,让机器帮你干活!
155 8
|
7月前
|
人工智能 计算机视觉
HarmonyOS NEXT AI基础视觉服务-背景替换
这是一个基于AI基础视觉服务的背景替换案例,通过调用设备相册选择图片并智能分割主体,支持动态更换背景颜色。主要步骤包括:1) 导入模块与定义组件;2) 实现图片选择与格式转换;3) 使用`subjectSegmentation.doSegmentation`接口完成主体分割;4) 通过随机RGB值实现背景色动态更换。代码结构清晰,功能完整,适合学习AI图像处理技术。
HarmonyOS NEXT AI基础视觉服务-背景替换
|
7月前
|
存储 人工智能 数据安全/隐私保护
HarmonyOS NEXT AI基础视觉服务-人脸对比
这是一套基于AI基础视觉服务实现的人脸对比系统,用户可通过调用设备相册选择两张图片,系统将提取人脸特征并计算相似度,最终以结构化数据形式展示对比结果(如相似度值和是否为同一人)。代码涵盖模块导入、双图选择、图像处理、人脸对比核心逻辑及UI界面构建,支持异常处理与权限管理,确保功能稳定性和兼容性。适配场景包括身份验证、人脸匹配等,具有较高的实用价值。
HarmonyOS NEXT AI基础视觉服务-人脸对比
|
7月前
|
人工智能 计算机视觉
HarmonyOS NEXT AI基础视觉服务-人脸识别
这是一个基于AI基础视觉服务的人脸识别案例,通过调用设备相册选择图片,利用MediaLibraryKit、ImageKit和CoreVisionKit等模块完成图像处理与人脸检测,并展示结构化结果。核心功能包括:相册访问授权、图像数据转换、人脸位置及特征点检测,最终以弹窗形式输出检测信息。代码涵盖模块导入、功能实现与UI构建,适合学习AI视觉应用开发流程。
|
7月前
|
人工智能 文字识别 计算机视觉
HarmonyOS NEXT AI基础视觉服务-文字识别
本案例展示了一款基于AI基础视觉服务的文字识别应用,通过调用设备相机拍摄照片并识别图片中的文字内容。主要实现步骤包括:1) 导入所需功能模块;2) 调用相机获取图片URI;3) 将图片转换为可识别的像素图;4) 配置视觉识别参数并执行文字识别;5) 构建界面组件,实现拍照与结果显示交互。核心要点涵盖相机权限、图像格式兼容及结构化识别结果处理,完整代码整合了各功能模块的调用流程,确保功能顺畅运行。
|
6月前
|
传感器 人工智能 自然语言处理
跨越机器物理世界和AI虚拟世界之间的鸿沟,是软硬件一体化创新关键 法思诺创新 法思诺创新​
法思诺创新专注于跨越机器物理世界与AI虚拟世界的鸿沟,推动软硬件一体化创新。在物理世界中,机器人虽有强壮躯体却缺乏灵活大脑;而在虚拟世界里,AI虽智慧无穷却无实体行动力。两者融合是未来智能化发展的关键。通过AI赋能,智能机器人已在智能制造、智慧物流、智慧服务及特种作业等领域大显身手。例如,AI工业机器人提升生产精度与效率,仓储机器人优化物流调度,服务机器人提供人性化交互,特种机器人执行危险任务。软硬件一体化创新实现了机器人感知、决策、运动和人机交互的全面智能化,是智能化时代的大势所趋。正如威廉·吉布森所言:“未来已来,只是尚未均匀分布。”率先拥抱软硬件一体化创新者,将赢得未来。
122 0
|
8月前
|
存储 人工智能 安全
有奖体验 AI 模特换装,解锁电商视觉新体验
在电商中,制作精美的商品展示图成本高且流程复杂。AI 换装技术允许商家快速更换模特的服装或配件,无需重新拍摄,大大缩短准备时间。这项技术减少了对专业摄影师和后期团队的依赖,使中小商家也能轻松产出高质量的商品图片,灵活响应市场变化,有效降低成本,提升竞争力。本方案利用函数计算 FC 构建 Web 服务,采用百炼视觉模型 qwen-vl-max-latest、aitryon、aitryon-refiner、shoemodel-v1 来分别实现 AI 人物主体信息提取、模特试衣、试衣精修、模特换鞋。

热门文章

最新文章