开发者社区> yq传送门> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

AI|揭秘阿里视觉计算团队:用机器替代人眼看透照片视频的秘密

简介: 如果说人工智能=数据+算法,那么大数据与云计算则可以称得上是人工智能的底层架构了。根据IEEE 院士、阿里云计算机视觉科学家华先胜博士介绍,目前,阿里云针对人工智能的发力点集中在计算机视觉、智能语音交互、和数据智能应用这三方面。
+关注继续查看

用机器替代人眼看透照片视频的秘密

cc250eefca075a125446a3516b657b5598549866

2016年初,华先胜加入阿里云并创立视觉计算团队,负责云上的视频图像智能分析、识别、搜索、生成和挖掘服务。2017年的春节前夕,阿里巴巴公布了2016年第三季度财报,其中阿里云计算业务本季营收为17.64亿元,同比增长115%,付费用户数量达到76.5万,同比增长100%——这已经是阿里云营收连续第7个季度保持100%以上的增幅了。2016年10月,阿里云计算项目“城市大脑”在杭州上线测试,通过接入交通监控视频等数据收集,对整个城市进行全局实时分析,自动调配公共资源,最终将进化成为能够治理城市的超级人工智能。

如果说人工智能=数据+算法,那么大数据与云计算则可以称得上是人工智能的底层架构了。根据IEEE 院士、阿里云计算机视觉科学家华先胜博士介绍,目前,阿里云针对人工智能的发力点集中在计算机视觉、智能语音交互、和数据智能应用这三方面。而随着近年来计算机视觉领域在深度学习方面陆续取得突破性成果,计算机视觉成了阿里云的首要落地技术之一。

d203ba0fc96678b60c0478ba7f43eda26c2a47dc

(IEEE 院士、阿里云计算机视觉科学家华先胜博士)

云计算、计算机视觉……啥?

云计算的概念就像人工智能一样广泛而模糊,简单来说,云计算平台的服务模式分为三类:SaaS(CRM、Email、在线游戏等)、PaaS(数据库,Web服务器、开发工具等)、IaaS(网络带宽、服务器、储存空间等)用户不再需要将资源下载到电脑里,只需要接入网络便可享受网络服务。

计算机视觉则属于人工智能学科的一部分,可以理解为用机器替代人眼,其中涵盖了图像与视频的分析、目标的检测与分割、人脸识别、物体识别、目标跟踪、视觉搜索等,背后需要强力的视觉算法支持。近年来,由于深度学习的兴起,以及计算机视觉技术利用深度学习,在人脸识别、物品识别等方面取得不少成就,近来声名鹊起的谷歌首席科学家李飞飞的研究领域之一便是计算机视觉,全球最大的图像识别数据库ImageNet也是由她参与创建。

d579b12e60f742ff0ed05e59ecb3e6d9e284858e

“城市大脑”的诞生

2015年,曾于微软任职14年的华先胜博士加入阿里巴巴,负责电商图片搜索引擎优化,最终的落地产品为应用在淘宝、天猫APP上的“拍立淘”——用户用手机拍摄物品照片后,便可以搜索相同或者相似的商品。2016年初,华先胜加入阿里云并创立视觉计算团队,负责云上的视频图像智能分析、识别、搜索、生成和挖掘服务。据华博士介绍,类似“拍立淘”、人脸识别“虚拟试妆”的电商相关项目由集团内部团队负责,阿里云主要还是负责对外业务,比如交通、安全、广告、工业等方面的应用。

2016年10月,阿里云计算的重要项目“城市大脑”在杭州上线测试,相似的技术也被阿里云应用在广州。“城市大脑”项目主要技术落点在于:

  1. 大规模视频分析处理。依靠阿里云的计算平台+视频分析特点,构建大规模视频分析平台,对整个城市交通状况有全面清晰透彻的了解。
  2. 城市图搜。将电商的图片搜索技术延伸到城市场景里来,完成城市索引。比如公安部门可接入系统,进行特定车辆类型、车牌的跟踪搜索。
  3. 交通监测。除了基本的城市观察(车流、人流)外,还可以检测车辆转向、速度、属性,同时监测公开场景下的特殊事件监测识别:车牌追踪监控、交通事故、违章停车、横穿马路等。
  4. 交通模型建立与交通优化。挖掘大量数据间的关系,发现规律,发现相互制约性。通过对交通、车牌、车型等数据的实时理解分析,判别交通流量,优化调整信号灯等。既可以周一到周日一次性离线优化,又可以在遇到交通事故、车流拥堵时进行实时调控,管控红绿灯。
370ef4f3c25cad33c1887922bebeda486a7ad1b4

一方面,并且由于城市监控摄像头数量众多,产生的视频数据量巨大,计算消耗大、吞吐量大,城市大脑需要在可控成本下提供大规模计算能力,并且保证计算效率——计算平台需要“吃得进去”,并且“消化的了”。据华博士所言,阿里的“飞天”云计算平台是一套超级计算机系统,拥有百万CPU合数,60万块硬盘支持。

另一方面,由于视频处理具有时空相关性:时间相关性,每一帧图像都依赖于先前的相关图像;空间相关性,交通场景下当前视频需要跟其他视频合在一起作决策。因此在视频处理时需要针对时空相关性优化算法研究,提升计算效率。

数据红利与算法优势逐渐减少,深耕行业,建立优秀商业模式

华博士认为,现在很多人工智能公司是以算法起家的,但是算法间的差异可能会越来越小,再加之基于深度学习的方法、各类开源算法的出现,内行高手之间算法差异不会有太大。比如ImageNet的图像识别大赛中,优胜者最后的数据差距都在小数点以后,虽然是真实场景下还是有差异,但是磨练起来将会逐渐减少,甚至包括数据差异也会越来越少,数据先发红利也会逐渐减少。

而除了算法以外,一个优秀的商业应用场景对于人工智能公司来说也同等重要。一个好的AI商业应用需要兼顾算法、数据、用户、平台、商业模式这五大方面。这五点虽然同维,但不同商业应用有不同侧重。对于人工智能公司来说,需要认真思考有没有好的商业应用、有没有真正深入行业产生价值、是否具备这五个基本要素是否都具备。

目前,人工智能已经在金融的人脸识别方面开始应用,安防、交通、工业也已经开始初步应用。设备端AI工具、智能陪伴、机器人、智能冰箱等,包括运用AI优化的搜索引擎,虽然听起来并不像“阿法狗”那样高级,但人工智能已经渗入到我们生活方方面面。

954f9fc3da36fd4f886fe45a39418e54675226ce

结语:AI时代的“基础设施”

阿里云的智能语音识别、图像搜索、人脸识别等相关的热弄智能技术都是从阿里内部的技术团队孵化而来,原本服务于电商体系,后续转移到阿里云计算平台体系上,配合搭建云计算生态,开放API,寻求合作伙伴。这一点与苹果、安卓搭建好操作系统后,各类APP陆续入驻类似。

阿里云的强大计算能力是无数中小企业无法企及的,但通过开放云计算平台,阿里云的用户获得了人工智能服务的能力,阿里巴巴也继续占据入口,试图成为AI时代的“基础设施”。


来源:智东西 作者:Lina

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
忆海原识发布类脑计算平台,下一代AI突破口到来!
近日,在 2022 WAIC AI 开发者日上,忆海原识创始人兼 CEO 任化龙发表主题演讲《类脑计算的发展与关键技术》。演讲中,他夯实细致地介绍了类脑智能的特点以及与传统技术的对比,以及忆海原识自主研发的 Ocean 类脑计算平台。
0 0
阿里云高性能计算负责人何万青:阿里云大计算加速HPC与AI融合
与AI相结合,高性能计算能够帮助科研人员将精力集中于专业领域。
0 0
【计算讲谈社】第八讲|AI 技术的“纺织业”是什么?
AI 商业化面临何种困局?破局的关键是什么?到底什么样的产业才能带动 AI 技术发展?8 月 12 日,阿里云【大咖说】全新子系列【计算讲谈社】第八讲《AI 技术的“纺织业”是什么?》上线,阿里巴巴研究员吴翰清(道哥)携学员展开分享和讨论。
0 0
【计算讲谈社】第七讲|AI 的价值探索:如何拓展商业边界?
当前 AI 行业处于什么发展阶段?AI 是工具还是目的?如何探索 AI 的应用边界?阿里云【大咖说】全新子系列【计算讲谈社】第七讲《AI 的价值探索:如何拓展商业边界?》上线,中科院博士李昊、阿里巴巴研究员吴翰清携学员共话“AI”。
0 0
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—14:10-14:50王亮教授《面向复杂视觉任务的视觉认知计算》
AI:2020年6月22日北京智源大会演讲分享之机器感知专题论坛—14:10-14:50王亮教授《面向复杂视觉任务的视觉认知计算》
0 0
AI药物发现实践与隐私安全计算
AI药物发现实践与隐私安全计算
0 0
微软行星云计算Planetary Computer——previsa南美洲亚马逊雨林森林损坏系统AI智能评估
微软行星云计算Planetary Computer——previsa南美洲亚马逊雨林森林损坏系统AI智能评估
0 0
Nature封面:乘着AI的翅膀,数据「带飞」计算社会科学!
Data Is Not All You Need! 如今有海量数据可供研究,确保数据质量和隐私变得更加紧迫。本期的「Nature封面」介绍了新兴研究领域「计算社会科学」,讨论了如何用大数据集解决社会问题。
0 0
整合全球新冠数据,华中大等开源联邦学习医学AI计算框架|Nature子刊
整合全球新冠数据,华中大等开源联邦学习医学AI计算框架|Nature子刊
0 0
数量级效率优势,原生适配AI计算:光芯片的下一个技术突破要来了
数量级效率优势,原生适配AI计算:光芯片的下一个技术突破要来了
0 0
+关注
文章
问答
文章排行榜
最热
最新
相关电子书
更多
视觉AI能力的开放现状及ModelScope实战
立即下载
通用多模态AI构建
立即下载
阿里云AI产品必知必会系列电子书
立即下载