10月24日(1024),是开发者的节日。
云栖社区也准备了一份特别的礼物:《2016杭州云栖大会回顾专题》,共计325+份PDF下载,100+场峰会与分论坛视频点播的专题送给大家!
也欢迎朋友们将参会感受、学习笔记等共享给我们(
yqeditor@list.alibaba-inc.com)
。
下文为《阿里云首席科学家周靖人:数据智能引领产业变革》,更多文章见这里。
10月13日,阿里云首席科学家周靖人在云栖大会主论坛上带来题为《数据智能引领产业变革》的主题演讲,他表示,随着计算能力提升、大数据和深度学习的发展,人工智能迎来了新的春天——数据智能时代。集合多年数据智能技术、代表领域最先进水平的阿里云人工智能ET,则在各行业进行创新、变革、数据化和智能化。
以下是演讲全文:
周靖人:大家好,各位来宾,各位领导,早上好!两个月前我们在北京首次发布了阿里云人工智能的品牌ET,ET本身代表了人工智能和大数据的完美结合,可以说,ET本身是代表了我们阿里云在数据智能这个时代最先进的技术和能力。
ET的首次亮相展示出了很好的交互能力以及认知能力,首先ET可以跟嘉宾一起进行交互,同时也可以欣赏,甚至解读体育的比赛,其实,这些背后就好像这个ET拥有耳朵、拥有眼睛、拥有嘴巴,能够跟人进行一个交互式的一个交谈,甚至能够理解人类的语言,人类的背后是大量的数据和大量的计算所获得的。
传统的人工智能往往由于计算的资源的缺乏,只能在少数的数据资源里进行训练,效果往往是差强人意,随着云计算和大数据的发展,计算能力可以得到极大的提升,同时辅以大数据和深度学习的发展,人工智能迎来了一个新的春天,这也是我们提到数据智能时代的到来。ET在数据时代的佼佼者,也带领了阿里云的最新技术。
在过去的几个月里面,我们数据的智能有长足的发展,再深入到各行各业,也引到了各行各业的变革和创新。刚才王坚博士介绍了杭州城市数据大脑,我们可以看到,一个智慧的城市的背后都有一个数据智能的大脑在进行掌控,大脑可以对各种数据进行整合和收集,同时,对城市的方方面面进行全面的量化,营造一个数据的生态,比如说我们可以对每一个城市建筑以及地理地形,包括周边的水利进行一个全面的数据化,并进行索引,这样我们可以建立一个3D的模型,这样的模型对城市的消防,对城市的急涝进行预估。
再谈到交通,这整个城市的交通,从道路、桥梁、路段、路网到当前的交通、状况以及人群的流动走向,可以通过视频、基站,甚至可以通过各种手机信息从不同的来源上云,让我们可以获得这些多种的数据源,在此之上,我们可以利用在视频方面的计算能力,可以对这些视频进行实时的分析,识别其中的对象,包括了机动车、非机动车、行人以及周围建筑或周围的植被等,同时我们也能分析出每一个机动车或行人当前行走的方向以及行走的速度,或是轨迹。
杭州市将整个这一切收集起来,可以建立一个全市非常完整的全量的交通模型,在建立这个交通模型的本身,是需要有大量的数据、大量的计算能力的,刚才王坚博士也提到,一个城市有上万的数据源,如何能够实时地将这些数据源上云,实时地进行分析,实时地进行归纳总结,这是一个非常具有挑战性的技术难题。
那在建立了这样一个城市数据生态之后,首先我们对每一个路段的交通情况有了一个实质的掌控,可以进行精准的流量分析,在此之上,我们可以进行非常精准的路况的预测,不光光是知道当前的路况,也需要知道5分钟以后、10分钟以后,乃至30分钟以后路况的情况,另外我们会根据这些路况的情况进行全程的路段的优化,比如说利用这个信号灯,这也是我们所提的,“互联网+信号灯”,利用交通的状况去调节红绿灯的配时,去疏导整个城市的拥塞的情况。在杭州市的试点里面里,可以提高车流量,在某些路段车流量可以达到11%,这显示了ET在指挥交通上的能力。
另外,这样一个全城市的交通模型也可以帮助我们进行特种情况的监控,比如说有一些车辆会运载着危险品或有一些重型的卡车,我们可以对这些比较危险的车辆进行实时的监控,另外,整个城市还存在着大量的物流配送,我们知道当今的城市,当今的互联网,整个城市里面有大量的短途的物流的配送,本身物流配送涉及到数量大,也涉及到目标分散,路况非常地复杂。
在ET,我们提供了一个智能的配送引擎,我们能够根据当前的交通情况,能够提出一个最佳的配送方案并进行最佳最优的路径设计,从而,我们可以减少在道路上的配送车辆,并提高货物的准时到达率。
这些数据还可以帮助我们对城市的规划进行一个非常好的提示,如我们要新建一个大型的人群聚集的场所,如电影院、医院等,我们都可以参考这样的数据对当前的交通、人群的流向进行分析,对整个的设计提出一个主导性的职责。
ET数据的智能不光光能够帮助城市的方方面面,也能够帮助传统的工业提高其效率。很多的工业制造非常复杂,涉及到上百甚至上千个参数,也存在随机性,参数的组合会导致良品率的提升或下降。
通过数字智能的技术,我们可以通过这些参数和良品率之间找到一些潜在的关系,通过大数据的能力,实时地去搜集在生产过程当中产生的成千上万的参数,进行实时地监控、实时的预测,并进行实时地调优,从而大大提高了良品率。在现在的工业制造里面,如果我们能够提高一个百分点的良品率,往往会造成成千上万,甚至上亿成本的节约,这对于一个企业有巨大的价值。
另外,在工业制造里面,很重要的一点是如何去优化其能耗,怎样去减少能耗的使用,比如说我们在炼钢当中有一个很重要的指标,整个的加热需要均匀,否则的话,钢就会断,整个加工的加热工艺是非常复杂的,我们如何能够从中用数据职能学到中间的关系,用数据智能去调优整个加工的流程,这样的话,我们可以减少能源的消耗,但同时也可以制造出高水准的钢。
另外,在复杂的设备,故障也是一个很大的难题,我们希望用数据智能的技术去估计,去有效地智能监测每一个设备,以提高其生产率,同时延长每一个设备的寿命。
比如说水电发电机,时时刻刻都在高速地运转,我们可以从水电发电机的传感器上面时刻地收集出各种感应数据,从而可以精确地了解到发电机上的负载以及它当前的健康状况,甚至可以预测出未来的故障周期。这样我们就可以提前进行检修,甚至可以提前地安排配件的运输,这些情况甚至可以延伸到整个设备的保修保险等。
那我们谈到了城市,我们谈到了工业,其实,数据智能还可以应用到农业,应用到渔业,这里我举了一个海洋渔业的例子,一艘渔船出海往往是几周,甚至上月,每行驶一海里,成本是非常高,那如何能够有效地找到鱼源,这对于海洋渔业公司来说是非常大的难题。整个鱼类的分布是动态的,它跟海洋的叶绿素的浓度以及海洋海表的温度以及海流的走向都是相关的。
ET通过数据智能,通过卫星遥感技术收集了大量的数据,包括海表的体温等,再结合数据的捕鱼信息,我们可以有效地预测出在某一个区域里面鱼量的多少。在这个例子里面,我们将每一个海域分配成了一个个小块,对每一个小块用机器学习的方式,用深度学习的方式去预估它潜在的产鱼量。
从这些信息有效地引导了海洋的公司去制造出最优的路径,能够最大效率地去提升捕鱼量。
另外,当前的社会是一个数据化的社会,几乎每一个人都被所有的数据化给包围了,如我们的手机,比如说我们每天的照片,比如说我们每次的摄像,家庭的录影等等,实际上我们每一个新生儿从它一诞生开始,伴随着他本身的成长,就会有大量的数据。ET具有很强的图形还有视觉的分析能力,我们可以有效地去分析这些照片和视频,帮助进行自动地去检测中间的人物、场景以及世界,而且对整个的这些信息进行索引,帮助我们有效地进行查找。整个ET可以帮助我们人类记录生活的轨迹,创造出一个非常美妙的数据的记忆。
那同时,这个数据智能也可以帮助到我们日常的娱乐生活,每一个人都有不同的信号,数据智能可以根据每一个人的喜好去推送不同的娱乐产品,甚至数据智能可以帮助我们挖掘每一个每一段视频潜在的价值,根据每一个人的喜好可以在每一段视频,每一段电影里频繁地加入各种元素,根据实现个性化、实现场景化等。
在语音分析,那我们的数据智能技术能够让万物来懂我们的人类,能够跟人类进行一个语言的交互。首先,我们的智能语音方面的技术可以应用到不同的设备上,包括手机,包括我们的互联网汽车,甚至包括我们在电视机等等,那同时,我们也可以应用到不同的行业,比如说在去年的双11,94%的客服是用我们语音的自然机器人完成的。
那在客服这方面,我还要再多举一个例子,客服方面另外一个很大的难题是怎么去做客服的质检。在过去往往是由一个团队是靠人力去做的,由于这个人力资源的有限,我们只能做1%的抽样或者是少量、更少量的抽样,由于有了我们智能语音的技术,我们可以通过机器对所有客服的语音样本进行实时的分析,而同时大大地提高了质检的命中率和有效率,但不需要有很大的人力的团队去支撑这样的一个高效的智能服务。
在医学方面,那我们最近也跟浙江大学一起合作,通过图像的分析,利用深度学习的技术,可以从医学的照片里面去学习,去自动找到相应的这个病变的可能区域,对整个医疗过程提出一个辅助的建议,整个技术,我们也逐渐在浙江省的各大医院进行推广,也产生了非常好的效果。
可以看到,我们当前数据智能的技术的确在影响着我们日常的各行各业,日常的各个方面的生活。在这个智能数据的背后,实际上有我们阿里云强大的基础建设,在整个数据智能的体验过程当中,阿里云是希望为在座的数据开发者提供一个基础建设,刚才唐洪也提到了,我们有非常强劲的云计算的平台,我们有大数据的平台,再加上我们人工智能的平台,这些都是我们在数据智能的基础,这都是我们在背后支撑ET的各种智能技术的一个源泉。
具体地来讲,我们有飞天大规模计算引擎,可以在上万个机器里面进行海量的数据处理,这包括离线的,包括实时的,包括准实时的,也包括结构化数据、非结构化数据,还包括中间提到的语音、各种图像、视频等。
同时,我们也有强大的一个分布式的机器学习平台,利用了各种硬件的资源,包括CPU、GPU、FPGA等等,这样可以支持百亿的特征,甚至千亿样本的高速的训练,整个平台也是开放的,我们可以接入各种机器的学习算法可以在平台上得到更好的运营。
在此之上,我们也提供了各种智能的认知服务,首先是智能的视觉技术,这个技术不光是在图像、视频上的认知,我们也提供高效的检索,再结合于大数据的能力,我们可以提供大规模的视觉数据处理的一个能力,刚才我们也提到了语音技术,那在强有力的语音核心技术之上,我们有一个开放的平台,可以让开发者很容易用API的形式进行调用。在此之上,我们也将语音技术应用到了不同的智能设备,包括了大家所戴的手表,包括大家所拥有的手机,甚至这个汽车、电视、机器人等等。在此之上,我们也搭建的各种行业的解决方案,如智能客服,在法庭或者说在电视机,在优酷等场景上面。
那最后呢,我想做一个简单的总结。
阿里云的ET是集合了我们阿里云多年开发的数据智能的技术,代表了整个领域的最先进的水平,我们也希望跟各位一起在各行各业里面进行创新,进行变革,进行数据化,进行智能化。
那今天我们在阿里云,ET在云栖大会上有一个专门的展台,我们也希望大家移步我们的展台跟机器进行一个真实的人机交互,好,谢谢大家!