3月27日,新智元2017开源·生态AI技术峰会盛大召开。这场中国“AI春节”由新智元携手英特尔联合举办。就在峰会召开的前几天,英特尔对外宣布组建了一个超级AI部门,而此前英特尔收购Mobileye的消息也引发业界震动,可以说今年英特尔对AI的关注达到了一个新的高点。而英特尔在产业里拥有端到端的独特优势,提供从服务器、开源平台到云计算的全方位解决方案,因此,英特尔的动向也是今年中国AI界值得关注的焦点。
在新智元“3·27”AI技术峰会上,英特尔中国研究院院长宋继强发表了题为《释放IA原力,拥抱AI时代》的主旨演讲,全面解读了英特尔在AI创新和生态上的战略布局。
人工智能甲子年,摩尔定律为神经网络研究做铺垫
去年是人工智能60周年,一个甲子。著名的摩尔定律也有50多年的历史,摩尔定律的提出者是英特尔的共同创始人,英特尔也是摩尔定律的践行者。摩尔定律和人工智能有什么交集呢?宋继强在演讲中做了梳理。
人工智能从上世纪50年代就开始了最初的研究,但那时的研究集中在逻辑推理上。这种方式过于复杂,到了上世纪70年代就走不下去了。80年代之后又开始了知识工程,发展了7、8年,非常红火。到了80年代末期,随着PC的兴起,大家发现原来在PC上也可以做相应的应用,而且为专门的知识工程打造的机器太贵,由此出现了一个低成本颠覆,这让人工智能陷入了第二次冬天。
1993年英特尔发布了奔腾处理器,这是一个划时代的处理器,让PC级的系统具有了很强的计算力。当时正在研究神经网络的学术界终于有了合适的消费级机器做实验,这样才有了之后二十几年逐渐发展起来的神经网络的研究。
数十年执行摩尔定律,屡屡冲破瓶颈,大数据洪流引爆人工智能
到了2000年以后,芯片工艺达到90纳米以下时遇到了很多问题,有很多猜测说摩尔定律可能延续不下去了。摩尔定律指出,每隔18-24个月,同样计算力的芯片可以用一半左右的价格买到。那么,2000年以后的摩尔定律是怎样的呢?英特尔的科学家和工程师一次又一次努力,在新的材料、新的技术上进行探索。45纳米的时候,英特尔用高K技术升级克服了漏电的问题,22纳米的时候,英特尔发明了3D晶体管,单个器件的尺寸变得更小,就这样不断把摩尔定律一步步往前推进,突破了很多瓶颈。这20年里计算机和手持设备的性能不断提升,现在手持设备的计算性能已经堪比当年的台式计算机。
同时我们也看到,随着传感器技术和无线通信技术的提升,有越来越多的数据可以被采集。比如说,拿着手机随便一拍就是几MB的图像,随便一录就是几GB的视频,预计到2020年一个互联网用户每天将产生1.5GB的数据。实际上,一家医院可以把所有的设备联网,把核磁共振成像等医疗数据放上网。而无人驾驶汽车一辆就能产生4个TB的数据,而且这些数据是多样化的,不再是以前计算机上常见的结构化数据,所以需要排除噪音进行解读。
由此形成的数据的洪流也是AI爆发的一个基础。
深度学习促奇点临近,AI需要民主化
深度学习其实是神经网络的一个升级换代的版本。随着计算能力的增强,我们可以把网络做得更深更宽,同时有足够的运算力、足够的存储,可以支持深度神经网络在可用的时间里训练出一个能够适应某个具体应用的模型。
现在我们发现深度学习特别适合处理图像数据,在过去几年里,计算机视觉识别的水平已经被推动到比人还好的地步,这也为我们带来了很强的对未来智能时代的预期。
我们有理由认为,人工智能在现在已经达到了爆发的临界点,后面还会有越来越强的计算能力,越来越多的数据以及算法的突破。预计到2020年,AI方面需要的计算力将增长12倍,而这12倍的计算力会给我们带来一个完全不一样的世界。
以英特尔所做的精准医疗为例,精准医疗需要做大量的运算,做基因组分析,分析医疗影像数据,以及实验室测试的数据等等。在人工智能技术的帮助下,原来需要几天才能做完的,未来可能只需要几个小时就能做完。
目前的人工智能处于一个技术升级的阶段,从技术升级跨越到产业升级才能实现真正的影响力。各行各业涉及很多具体的应用,每一个应用都会有专门的端到端的数据处理、分析、展现的要求,每一个应用实际上都需要不同的人来使用人工智能技术把它做好。宋继强提出了两个要求,一是人工智能的能力要增强,而且要加速适应到不同行业里去,二是要能够让更多人很方便地使用人工智能的技术。这两点也最为英特尔所看重,是AI民主化,或者说推进AI应用普及的重要因素。
人工智能放在前端设备还是云端?
人工智能既涵盖前端的设备又有后端的云,我们应该把人工智能放在哪儿?是放在前端的设备里面,还是放在云端?宋继强认为,需要具体问题具体分析。
英特尔收购了Mobileye,有人说这是增强英特尔进军自动驾驶的实力。但是,自动驾驶是不是Mobileye一家的能力就够了?一辆汽车要自动跑起来,需要模拟人的视觉、听觉和其它感知能力,对环境进行建模,还要快速做出智能的判断来操控车辆,因此环境建模需要与传感器数据相融合。不仅仅有图像数据,还有超声波、激光雷达,所有这些不同的数据都需要不同的处理。自动驾驶如果出现问题关乎人命,因此控制者的反应速度非常重要。而自动驾驶汽车(也即前端设备)本身也一定要有足够强的实时处理能力。
但在很多重要场景下,云端仍然非常有用。如果汽车终端收集上来的数据要放在云端做综合处理,可以为整个城市的交通做更好的规管。在云端,还可以用这些数据为自动驾驶训练边界情况。因此,根据情况,人工智能既可在云端,也可在前端,还可以两者都部署。
闭环!闭环!闭环!
综上,大家就能理解为什么英特尔从去年的 AI Day 开始,一直表明自己是在做一个闭环,这个环是从前端的数据采集开始,经过数据通信网络和移动计算能力上到云端,在云端做更大量的优化训练,再反馈到前端。英特尔认为,这个环必须时刻运转,不需要停止,也不能够停止。在这个环上,用户需要很多种不同级别和种类的软硬件加速的方案。因此,收购后的Mobileye也只是其中的一个方案,并非全部,而全部的方案需要很多技术去综合配合,才能让无人驾驶应用真正实现产业化落地。
就在上周,英特尔新成立了一个部门,名为人工智能产品事业部(AIPG),针对AI产品的片段去做各种解决方案。在云端有多种支持的方法,除了刚才说过的,在实际应用中还需要处理大量的视觉、声音等各种数据,进行归纳和推理。此外,还会有通用计算的需求,以及专门针对某些负载去做针对性的加速。从PPT上可以看出,越往左边就越通用,越往右边越专用,用户可以很容易地切换需要处理的应用类型,但都能达到理想的计算的加速。
英特尔的硬件产品有很多。要很方便地使用这些硬件,上面的软件堆栈非常重要。中间这三层就是软件的堆栈,底下一层英特尔会隐藏掉不同硬件间的差异,让上层的框架能够以同样的方式去使用底层硬件的能力。其中包括了最新的关联记忆库,可以利用更长期的一些记忆去处理可能存在的模式和规律。中间这层可以支持很多开源的深度学习框架和大数据模型,可以让用户将在其他框架下开发出来的模型迅速地部署在英特尔的平台上。工具层能够让用户更快地将英特尔的一些最新的方案使用到自己的系统和方案里,这些都涉及到很多不同的工具。最上层则必须按照不同行业应用的要求去优化整个堆栈。
开源和生态
提到开源和生态——新智元“3·27”AI技术峰会的主题,宋继强以英特尔的开源平台BigDL为例,介绍了英特尔为什么要做开源框架并且整合大数据。宋继强指出,人工智能处理的实际上是整个数据链条中的一个环节,而要真正要构造一个完整的应用,则需要经历从采集数据,分类数据、过滤数据(比如去除掉一些涉及隐私的数据)的流程,最后才会给到人工智能的模块做处理。输出也要配合别的数据做融合,还要以某种方式可视化,或者以可控制的方式回馈给系统。所以,整个处理链条仍然是和以前大数据业务十分类似,只不过中间加入人工智能赋予的一些能力。
英特尔会提出BigDL这样一个框架,就是为了方便以前使用Spark这样的开源框架的用户去做各种数据的开发软件,让他们可以无缝使用深度学习、使用人工智能带来的一些能力,这也是让AI民主化的一个很好的例子。
同时,为了方便更多的初学者和其他领域的爱好者使用AI,或者使用英特尔的一些产品,英特尔还开设了一个人工智能学院,由Nervana领导。宋继强介绍说,英特尔收购 Nervana后,Nervana 实际上就成了英特尔人工智能产品线的代名词。在这个新的人工智能学院里,英特尔会提供线上的培训工具,还会提供很多线上课程让大家自己学习AI的基本的理论工具和模型。在这个基础上,用户可以使用刚才介绍的英特尔的一系列工具,加速推进AI项目。不仅如此,在人工智能学院还有社区,用户能在这里和行业里的伙伴以及英特尔的技术专家一起去讨论怎样更快地进行协作。
宋继强说,我们当前正好处在人工智能技术升级的当口,对于像人工智能这么大的一个产业,要实现产业成功升级,光有一家公司是不够的,他们希望大家能够共同合作来支持开放的数据交换和知识共享。举个例子,在精准医疗领域,英特尔在中国有一个合作伙伴项目,致力于推动不同机构之间的数据交换和合作。精准医疗这个领域需要很多的数据,而这些数据很多时候又在不同医院或医疗机构的手里,只有开放才能共赢。因此,英特尔更希望有政府或者一些NGO的组织一起来协作,推动各个行业都能够用一些标准化的方式使用人工智能的这些能力。
引导AI,承担社会责任
最后,宋继强介绍了英特尔将人工智能技术用于社会服务的例子。宋继强说,人工智能是一个非常颠覆性的技术,AI 和之前的一些科技创新一样,可以用在好的地方,也可以被人用在不好的地方。英特尔作为具备社会责任感的公司,一定会推动跟产业合作,让AI能用在正确的地方,发挥积极的作用。
第一个例子是疾病治疗。英特尔在美国跟一些医疗机构合作利用大数据和人工智能,做了治疗帕金森症的项目,还有协作式的癌症云。在中国,英特尔还参与了知识产权和隐私保密相关的项目,英特尔与京东合作,使用人工智能很好的应对了去年双十一侵权和非法图片使用的问题。宋继强介绍说,在双十一的时候有数以亿计的用户和商家一起在网上推一些图片,单靠人力无法快速准确地筛选出其中有知识产权问题的图片,而通过使用英特尔的一些方案,搜索速度提升了4倍,很好地解决了这一问题。
除了数据的安全和隐私,人工智能还应该让我们的社会更加安全。右边这幅图展示了一个非常有意义的工作——寻找失踪儿童和被虐待儿童。在美国有一个专门帮助寻找失踪儿童、救助被虐待儿童的组织,这个组织去年收到800万份报告,每份报告里面都含一些视频资料、影像资料,如果靠人去看需要30天才能把一个个案分析出来。现在,他们与英特尔合作,希望借助英特尔的人工智能技术,将时间缩短到一天以内。宋继强说,“你想想如果一个走失的儿童,或者是一个正在遭受迫害的儿童,一个月对他来讲是什么概念。”如果真的做到了,这个意义将是难以估量的。此外,宋继强还介绍了平安城市、智慧金融等例子,说明英特尔积极使用人工智能,真正提升我们生活的安全性和满意度。
人工智能到了转折点,只有产业才能真正推进技术
英特尔在中国已经扎根30多年,在行业里和很多公司和机构都有密切的合作,包括互联网公司、内容提供商、银行,提供语音、视觉的垂直领域公司,还有大学。英特尔的目标是让AI创新可以在多个不同的行业里面去开展生态合作和应用,从而把社会价值呈现最大化,促进产业的升级。
宋继强指出,人工智能目前已经到了一个转折点,我们都希望这一波热潮能够持续下去,不会再因为一些不确定性的因素再进入一个冬天。所以,就更需要大家一起合作,把学术、技术的升级真正应用到产业里面,变成产业的升级——只有产业才能把技术真正推动下去。
宋继强说:“我们认为现在已经是一个很好的时机,让大家去想想怎么在你的产品里、在你的服务里面去植入AI的技术。我们希望能尽英特尔的一些力量,来助大家一臂之力,共建AI的生态,让我们的明天越来越好。”
新智元专访:哪三项人工智能研究让宋继强引以为豪?
在新智元开源·生态AI技术峰会结束后,宋继强接受了新智元的独家专访,提到了英特尔中国研究院最令他自豪的三项人工智能研究:计算机视觉、环境物体识别、自适应人机交互。
宋继强认为英特尔中国研究院很适时地赶上了AI浪潮。3年前,他们做计算机视觉的研究时,就已经开始去钻研深度学习这一技术方向,而且取得了不错的成果。宋继强说:“基于视觉的理解,做人脸表情的处理,我们已经是在国际的学术比赛上拿到第一、第二的这种级别。”
第二个研究是从视觉理解扩展而来的物体识别、环境理解等领域。例如平安城市里的数字监控系统,需要理解这个场景里发生了什么,理解除了人脸之外的其他物体。这一块,英特尔深入跟产品部门共同合作,把新技术用在产品里。此外,英特尔也积极应对无人驾驶方面的一些挑战,把这个技术升级带到产业升级里边。
第三个跟人工智能相关的就是服务机器人,也称为自适应的人机交互。人工智能应用实际上是针对某些具体的需求再训练一些能力,通常不能保证百分百可靠,特别在遇到一些新的场景或者一些并不太好的视角时,执行度不是很高。但是,在产品级应用中,必须提供一致的用户体验,不能因为看不清就不做。对此,英特尔将AI的技术和人的交互放在一起,去弥补AI的不足。换句话说,在AI不足的某些情况下,充分利用人的智能。“让机器可以跟人学,根据这个互动,我还可以去逐步了解我服务的用户有什么特性,逐渐做一些个性化服务。”宋继强说。
产业上游的英特尔在开源生态中位置在哪儿?
“开源”和“技术”是新智元本次AI技术峰会的主题,宋继强怎么看待现在中国的开源生态环境?英特尔这样的大公司在这样一个开源生态环境中又扮演怎样的角色呢?
宋继强表示,开源生态是非常好的,特别是对于AI技术,本身的学术门槛加上产业化门槛都比较高,所以现在一些大公司都在纷纷推出自己的开源方案,把这个门槛降低。
英特尔在开源方面也投入很多,包括以前开源操作系统Linux和后来的Spark。宋继强说,在Spark里边,英特尔是贡献最多的企业之一。现在,英特尔会把开源这块的优势加上人工智能一起继续做好,让已经习惯了使用这些开源方案的用户可以很容易地去使用AI技术,从而带来一些新能力。宋继强说:“总的来说,开源的生态对于在这种新的领域实现快速的产业化是非常有帮助的。英特尔会巩固并加强曾经的开源优势,在AI时代持续帮助开源生态的建设。”
最后,宋继强还提到对于本次开源技术大会的感受,他说:“我觉得现场非常热烈,而且技术专家云集,同时有创业家和比较成熟的企业家,像滴滴、百度、腾讯,也有高校里边的专家学者,也有像英特尔这种产业链上游布局的,还有很多根植于AI产业的顶级VC。他们观察产业的思路也反馈给参与会议的学者,或者创业家,我觉得这些都挺好的。”
文章转自新智元公众号,原文链接