阿里巴巴“NASA计划”新进展:刷新视觉计算世界纪录

简介: 5月18日,全球权威机器视觉算法测评平台KITTI的世界纪录再此被刷新。阿里云将其车辆检测的准确率拉升至90.46%。阿里巴巴iDST视觉计算研究员华先胜详细解读了背后的技术。

5 18 日,全球权威机器视觉算法测评平台 KITTI 的世界纪录再此被刷新。来自中国的科技公司阿里云将其车辆检测的准确率拉升至 90.46% 。车辆检测被认为是实现无人驾驶的关键技术,极具挑战。


7f254be5de921ebe01ad24ffae3feb466ded5f76

据了解,此次重大技术突破是由阿里巴巴iDST视觉计算研究员华先胜领导的团队完成。他们提出了基于区域融合决策和上下文相关的多任务深度神经网络,用于复杂场景下的车辆检测任务,重点解决其中多视角,多姿态以及车辆遮挡等问题。

在网络结构设计上,团队利用反卷积操作提高了小目标的召回率,同时拼接了多层特征以融合低层的局部信息和高层的语义信息,提高了边框定位的准确率。在训练过程中,还借鉴了GAN(生成对抗网络)中的对抗训练模式。

华先胜表示,现在我们已经将这样的技术集成到阿里云ET当中,并在城市大脑中得以应用。它能够帮助城市大脑准确的看懂车流信息,快速的做出全局性判断。华先胜是视觉识别和搜索领域的国际级权威学者,曾获选国际电气与电子工程协会院士(IEEE Fellow)、美国计算机协会ACM杰出科学家。

城市大脑是包括阿里云在内的13家企业联合杭州市政府发起的项目,旨在构建一个城市级的人工智能中枢,让城市能够与人类友好互动。这其中分析视频是城市大脑获取信息的关键。

以交通治理为例,通过这项技术,城市大脑通过普通摄像头就可以感知复杂路况下车辆的运行状态和轨迹,对这些数据进行实时分析。基于此,进行多种智能交通优化。在视频数据处理规模上,全球罕有。

 

在视觉计算领域的持续攻坚,是阿里巴巴“NASA”计划的一部分。该计划聚焦于机器学习、芯片、IoT、操作系统、生物识别等核心领域,他们希望能解决10年、20年后的困难。此前,已在光量子计算机、全浸没液冷服务器等方面取得重大进展。


KITTI是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集,可以用于评测目标检测等计算机视觉技术在复杂真实环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,有大量的微小目标、欠曝和过曝、多种视角变化以及各种遮挡情况。

 

相关文章
|
21天前
|
人工智能
破壁人AI百度:科技公司反内卷的典型样本
请你仅使用两个栈实现先入先出队列。队列应当支持一般队列支持的所有操作(push、pop、peek、empty): 实现 MyQueue 类: void push(int x) 将元素 x 推到队列的末尾 int pop() 从队列的开头移除并返回元素 int peek() 返回队列开头的元素 boolean empty() 如果队列为空,返回 true ;否则,返回 false class MyQueue: def __init__(self): self.stack_in=[] self.stack_out=[] def push(
12 3
|
9天前
|
机器学习/深度学习 敏捷开发 人工智能
技术创新与实践:从理论到应用的跨越
在当今快速发展的科技时代,技术创新已成为推动社会进步的引擎。本文探讨了技术创新的重要性以及理论与实践之间的密切关系,通过案例分析和实践经验总结,展示了技术创新从理论到应用的跨越,以及其在各个领域的应用前景。
14 0
|
人工智能 自然语言处理 自动驾驶
破壁人AI百度:科技公司反内卷的典型样本
简介:破壁人AI百度:科技公司反内卷的典型样本 。
破壁人AI百度:科技公司反内卷的典型样本
|
人工智能 自然语言处理 自动驾驶
破壁人 AI 百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。
破壁人 AI 百度:科技公司反内卷的典型样本
|
8月前
|
机器学习/深度学习 Web App开发 人工智能
领航未来,探索AI无尽前沿:2023年WAIC云帆奖得主揭晓
领航未来,探索AI无尽前沿:2023年WAIC云帆奖得主揭晓
460 0
|
9月前
|
存储 弹性计算 运维
阿里云云电脑怎么样?价格是多少?可以代替传统电脑吗?
阿里云云电脑怎么样?价格是多少?可以代替传统电脑吗?
389 0
|
9月前
|
存储 弹性计算 运维
阿里云电脑无影云桌面收费标准(CPU内存/云盘/互联网带宽)
阿里云电脑无影云桌面收费标准(CPU内存/云盘/互联网带宽)阿里云无影云电脑配置具体价格表,无影云桌面4核8G企业办公型云电脑可以免费使用3个月,无影云电脑地域不同价格不同,无影云电脑价格是由云桌面配置、云盘价格、互联网访问带宽价格、AD Connector 价格、桌面组共用桌面session 价格等费用组成
682 0
|
4月前
|
存储 弹性计算 运维
阿里云服务器经济型e实例特点、适用场景介绍和使用常见问题及答案
经济型e实例是阿里云面向个人开发者、学生、小微企业,在中小型网站建设、开发测试、轻量级应用等场景推出的全新入门级云服务器,它属于共享型实例规格,在资源利用上侧重于资源性能的共享,所以经济型e实例的云服务器价格往往比其他实例规格的云服务器价格要低,本文为大家介绍经济型e实例特点、适用场景以及使用过程中的常见问题和答案。
阿里云服务器经济型e实例特点、适用场景介绍和使用常见问题及答案
|
11月前
|
机器学习/深度学习 人工智能 文字识别
从模式识别到图像文档分析——浅析场景文本识别研究
文本检测领域经历了从水平文字检测到多方向文字检测再到任意形状文字检测这样越来越有挑战性的应用场景转变。 在复杂场景下,由于光照、遮挡等因素的影响,图像中的文本经常会出现模糊、失真、变形等问题;其次,文本与背景之间偶尔存在相似度较高的情况,文字颜色和背景颜色相近或者噪点过多等情况会严重干扰文本的准确识别;此外,在某些场景下(如手写体、印章、二维码等),不同于常规字体的字形特征也会增加识别难度。复杂场景下的文本识别依然是目前难以解决的问题。