今天上午在北京举行的GMIC大会上,Facebook首席AI科学家Yann LeCun进行了主题演讲。他介绍了当前AI的一些最新进展,FAIR在计算机视觉、机器翻译等领域提出的一些最先进的架构。LeCun认为,监督学习不会被替代,但监督会不断减少,或者不断弱化。他强调了可微分编程的潜力,称未来还会出现更多的有关深度学习的变革,比如说更复杂的架构,同时也会出现更多的新理论。
Yann LeCun(杨立昆)首先介绍了今天的基于监督学习的AI系统。今天所有的应用,不管是影像、声音或者是图像的识别,或者一种语言翻译到另外一种语言,以及测试等等,都可以利用AI。通过深度学习我们可以训练机器,比如说向它展示一个车的图像,它就会知道这是一辆车,下次向机器展示同一个图像的话你就会得到你想要的答案。在这种监督下的学习对于计算机学习说是非常重要的。
深度学习与传统的机器学习有所不同。端到端的训练可以让机器完成某一项任务,它会告诉你最后的输出是什么。机器会学习整个过程,这是端到端的一个学习过程。通过这种方式,计算机能够更好地了解我们的世界。
卷积网络(Convolutional Nets)的想法可以回溯到上个世纪八十年代的时候。它可用于识别图像,同时也有很多其他的应用,比如说可以用于语言处理、语音识别等等。
我们知道神经网络是非常大的,只有在非常强大的计算机上才可以运用,需要有 GPU 加以辅助。在深度学习变得普遍之前,我们需要确保这样的系统可以用。比如说其中的一个例子是我们在 2009 年、2010 年在纽约大学合作的一个实验,这个系统可以识别图像,可以看出马路上的建筑,天空以及路上的车和人等等。这个当时并不是最好的系统,但是我们可以利用这样的技术来去识别一些车辆。
再过几年之后,就有一些公司做了更好、更深的系统。因为深度学习的革命,越来越多人相信深度学习是可以奏效、可以发挥作用的。
大家可以看到在网络的层数越来越深,比如说有 100 层或者 180 层的一些人工神经网络。可以看到随着网络加深,识别的错误率是在不断的下降。有的时候表现得甚至要比人还要好。
这个是我们 Facebook 人工智能部门所做的研究,叫做 Mask-RCNN,可以看到它展示出非常好的性能。它不仅仅可以识别出每个人,同时它会为每个人加一个 Mask,所以可以很容易区分出是一个人还是一只狗。在这里大家可以看到它可以识别电脑、酒杯、人、桌子,都可以识别出来。而且也可以数出来到底有多少,而且也可以识别出道路、汽车。
如果五年之前问系统这些问题的话,我们当时可能认为需要 10-20 年时间才能达到今天呈现的效果。
这也是 Facebook 所做的一些研究,叫做 DensePose,它可以实现实时的人体姿势估计。我们不仅仅发布了论文,同时连代码也都发布出来了,这样的话世界各地都可以更好的熟知这种技术。
利用这样的技术,我们可以预测人类的行为,不知道大家是不是能够看得清这个视频,我们现在有一个系统能够实时的运行,在一个单一的 GPU 上运行。它可以跟踪很多人的行为,生成视频,而且非常的准确。而且可以实时地生成一些相应的数据和信息,相应的代码也是可以用的。这些都是 Facebook 最新的研究。
当然利用的这样的技术不仅仅可以进行图像识别,可以识别人的行动,也可以使用计算机序列来进行机器翻译。这是 Facebook 在加州所做的研究,可以从一种语言翻译到另外一种语言。
我觉得对于行业说进行这样的开发研究将是会是一个非常有用的过程。对于我们研究团队来说,不仅仅要开发对我们公司来说非常有用的技术,同时我们也希望所开发的技术能够引导整个社区,能够解决我们所感兴趣的问题。我们认为 AI 不仅仅会帮助我们解决问题,同时还会帮助我们解决很多人类自己无法解决的挑战,所以我们会与我们的科学团队一起朝这方面努力。这里是在过去的几年里,FAIR 所发布的一些开源项目,包括像深度学习网络,还有深度学习框架等等。
接下来我们再来看一下可微分的编程。我们可以从另外一个角度来学习深度学习。实际上它也是一个固定的架构,它涉及到去进行编程,这个编程可以用人工神经网络解释。这个编程一共有三个指数,它实际上和人工神经网络非常的类似,但它会根据所展示的数据有所不同。另外,根据数据系统也会有所变化。
所以现在的问题是,我们是否有一种方法可以自动地生成一个自己的程序。同时可以对其进行培训完成某一个具体的任务,这也就是我们所说的可微分编程的想法。现在人们已经开始在做一些深度学习方面的研究。
前面讲了深度学习最新的成就,让我们来看一下目前的 AI 尚没有触及到的一些能力。比如在医学方面,我们还可以进行更多的影响分析。比如深度学习方面我们要进行更深入的挖掘,因为机器本身会有不同的解决方案,在实际生活中是不能够去实施的。我觉得有些核心的功能方面,我们确实现在还没有触及到。这些是机器能够做到的,但是我们还没有挖掘出来。
我们希望机器能够建立一些样本,能够使得我们系统运行,最终机器会得到学习,以及进行一些预测。我们希望可以使得机器像人一样的有效地运行,它们能够进行规划,进行反映。
最后我想做一下总结,我觉得监督学习和强化学习会变得更加完善,通过自我监督的学习,但不会被替代。这点已经引起了很多人的兴趣,就是接下来几年还会持续的发展。我相信这也会使得我们进行更多的尝试。
接下来我相信我们会不断的进行演变,而且我们也要来朝着可微分的智能学习的方向持续的发展,这就需要我们来进行对抗性训练更多的研究。当然了,还会出现更多的有关深度学习的变革,比如说包括了有一些多渠道的发展或者是复杂的架构,而且会出现更多的理论。
技术的趋势是这样的,很显然监督会不断减少,或者不断弱化,出现无监督的Feature Learning,有监督的Fine-Turning。这就使得我们出现一些新的理论,我相信之后应该有多维度的可能性。我们会发现出现一些新的框架,包括了一些动态的影像,而且我们诠释的能力会不断的提升,我们也会不断地开源。另外,这也使得我们需要不断地升级硬件,以便使得用户的需求能够得到专业化的处理。
原文发布时间为:2018-04-26
本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。