阿里巴巴的机器视觉有多强!ET城市大脑发布四大AI视觉产品

简介: 7月4日,阿里云ET城市大脑发布其第四款AI视觉产品“天擎”。阿里巴巴机器智能实验室副主任华先胜博士介绍,“天擎”可以用1分钟处理16小时的视频,处理分析速度惊人。除了“天擎”之外,ET城市大脑还有天曜、天鹰、天机三款AI视觉产品。

7月4日,阿里云ET城市大脑发布其第四款AI视觉产品“天擎”。阿里巴巴机器智能实验室副主任华先胜博士介绍,“天擎”可以用1分钟处理16小时的视频,处理分析速度惊人。

“摄像头”是ET城市大脑的眼睛,城市中有数以万计的摄像头,每天产出的海量视频数据不仅数量大,相当于1000亿张图片,一个人看完所有视频需要100年;而且难以理解,机器无法直接看懂,要先对视频信息作结构化处理,翻译成机器可以理解的二进制语言。

“天擎”就是ET城市大脑处理视频信息的发动机,负责把海量的视频图像信息在最短的时间内处理为二进制语言,从而为之后的车辆识别检测、行人识别检测提供基础。

除了“天擎”之外,ET城市大脑还有天曜、天鹰、天机三款AI视觉产品。

image

据媒体报道,杭州700多个道路断面已经接入“天曜”,24小时自动实时巡逻,对交通违章、交通事故等的报警反应速度在20秒内,准确率达95%以上。

image

“天鹰”能够快速识别车辆、行人,能够用于失踪人口、肇事车辆逃逸等场景。衢州城市大脑已经借助“天鹰”建立起了智能化安防体系。

“天机”则可以通过区域内的历史视频数据,预测未来的车辆、人流量,从而合理安排出警、人员接送车等,做好交通疏导,避免发生拥堵和安全问题。

据全球权威咨询与服务机构Forrester最近的报告,阿里云入选国内厂商机器视觉的最强阵营。以阿里云为代表,阿里巴巴的机器视觉能力不容小觑。

在去年的杭州云栖大会上,达摩院正式成立。在达摩院中,就有两位机器视觉的大牛人物:任小枫和华先胜。

任小枫在计算机视觉领域中对图像分类,物体识别、跟踪、检测,事件检测都有全面且深入的理解,华先胜是IEEE(国际电气与电子工程师协会)院士,视觉识别和搜索领域的国际级权威学者。

image

阿里巴巴机器智能实验室主任金榕(中)

阿里巴巴机器智能实验室副主任任小枫(左)、华先胜(右)

除此之外,成立8个月来达摩院获得了约20项国际顶级技术赛事第一,其中有多项和机器视觉有关。

image

例如,在机器视觉知名赛事Pascal VOC Comp4目标检测上夺得第一,可用于农作物检测,预防早期病虫害。

image

首次参加国际最大的自动驾驶计算机视觉算法集KITTI,将三项道路场景分割任务第一收入囊中。

image

世界知名行人再识别数据集Market1501首位命中率长期由达摩院占据第一。

除了这些国际技术赛事外,阿里巴巴的机器视觉还被用于肺结节诊断、电池片内部缺陷等实际问题。

成立达摩院之初,马云为达摩院设立了三项原则:第一达摩院必须比阿里巴巴生存得长久;其次,服务全世界至少20亿人口;第三,必须面向未来,其必须解决人类未来面临的问题和解决未来自立生存问题。

现在,阿里巴巴真的在不断探索新科技,令人钦佩!

相关文章
|
13天前
|
人工智能 编解码 安全
[译][AI OpenAI-doc] 视觉
学习如何使用 GPT-4 来理解图像。具有视觉功能的 GPT-4 Turbo 允许模型接收图像并回答与之相关的问题。了解图像上传、处理、成本计算、模型限制等详细信息。
|
13天前
|
机器学习/深度学习 人工智能 TensorFlow
倚天产品介绍|倚天性能优化—YCL AI计算库在resnet50上的优化
Yitian710 作为平头哥第一代ARM通用芯片,在AI场景与X86相比,软件生态与推理性能都存在一定的短板,本文旨在通过倚天AI计算库的优化,打造适合ARM架构的软件平台,提升倚天性能
|
13天前
|
人工智能 分布式计算 大数据
大数据&AI产品月刊【2024年3月】
大数据&AI产品技术月刊【2024年3月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。
|
13天前
|
机器学习/深度学习 人工智能 语音技术
阿里旗下通义系列AI产品有哪些?
【2月更文挑战第16天】阿里旗下通义系列AI产品有哪些?
657 2
阿里旗下通义系列AI产品有哪些?
|
13天前
|
人工智能 Windows
LabVIEW将视觉生成器AI用作OPC服务器
LabVIEW将视觉生成器AI用作OPC服务器
27 2
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
OpenAI 推出 GPT-4o,免费向所有人提供GPT-4级别的AI ,可以实时对音频、视觉和文本进行推理,附使用详细指南
GPT-4o不仅提供与GPT-4同等程度的模型能力,推理速度还更快,还能提供同时理解文本、图像、音频等内容的多模态能力,无论你是付费用户,还是免费用户,都能通过它体验GPT-4了
62 1
|
13天前
|
人工智能 分布式计算 Cloud Native
大数据&AI产品月刊【2024年4月】
大数据&AI产品技术月刊【2024年4月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。
|
13天前
|
消息中间件 人工智能 监控
|
13天前
|
机器学习/深度学习 人工智能 搜索推荐
【AI 场景】如何使用 AI 向客户推荐个性化产品?
【5月更文挑战第3天】【AI 场景】如何使用 AI 向客户推荐个性化产品?
【AI 场景】如何使用 AI 向客户推荐个性化产品?
|
13天前
|
人工智能 编解码 安全
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
【4月更文挑战第14天】清华大学与新加坡国立大学团队针对大型多模态模型(LMMs)在处理高分辨率图像时的局限,提出新模型LLaVA-UHD。该模型通过图像模块化、压缩和空间模式组织策略,有效提升了处理任意比例和高分辨率图像的能力。实验显示,LLaVA-UHD在9个基准测试中超越现有模型,且在TextVQA任务上准确率提升6.4%,同时训练时间更短。然而,模型训练成本高、泛化能力待优化是未来需解决的问题。
36 8
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

热门文章

最新文章