【深度学习卡住了】技术缺陷根本无法解决,算法领域没有重大突破

简介:

我们被卡住了,或者至少我们处于瓶颈期。

谁还记得算法、芯片或数据处理领域上一次整整一年都没有重大、显著的进步是啥时候?几周前我参加Strata圣何塞大会,却没有看到引人注目的新进展,这太不同寻常了。

我之前报道过,我们似乎进入了成熟期,现在我们的主要精力是确保所有强大的新技术很好地协同工作(融合平台),或者从那些大规模的风险投资获得回报。

并非只有我一人注意到了这个问题。几位与会者和参展商的看法与我非常相似。有一天我收到了几位知名研究人员发来的研究纪要,他们一直在评估不同高级分析平台的相对优点,得出的结论是,没有任何不一样的地方值得报告。

22749bf7e45396dc852175ea997b63fcddab2d5b

我们为何卡住?卡在哪里?

我们现在的处境实际上并非很糟糕。在过去的两三年,我们取得的进展都在深度学习和强化学习这个领域。深度学习在处理语音、文本、图像和视频方面为我们带来了出色的功能。加上强化学习,我们在游戏、自动驾驶汽车笔机器人等方面取得了重大进展。

我们现处在基于这些技术的商业爆炸式发展的最初阶段,比如通过聊天机器人大大简化客户互动、新的个人便利应用(比如个人助理和Alexa),以及私家车中的二级自动化(比如自适应巡航控制、避免事故制动和车道维护)。

Tensorflow、Keras及其他深度学习平台比以往更易于使用,而且得益于GPU,比以往更高效。

然而,已知的一系列缺点根本没有解决掉。

  1. 需要太多标注的训练数据。

  2. 模型需要花太长的时间或太多的昂贵资源来训练,但仍有可能根本无法训练。

  3. 尤其是节点和层方面的超参数依然很神秘。自动化或甚至被广泛接受的经验法则仍遥遥无期。

  4. 迁移学习只意味着从复杂迁移到简单,而不是从一个逻辑系统迁移到另一个逻辑系统。

我确信问题还有更多。我们卡就卡在了解决这些主要的缺点上。

什么让我们止步不前?

以深度神经网络(DNN)为例,眼下的传统观点认为,如果我们继续推进、继续投入,那么这些缺点就会被克服。比如说,从上世纪80年代到2000年代,我们知道如何使DNN工作,但根本没有相应的硬件。一旦克服了这个难题,DNN结合新的开源理念就会打破这个新领域的瓶颈。

各种类型的研究都有自己的发展势头,尤其是,一旦你往某个特定的方向投入了大量的时间和财力,会一直往这个方向前进。如果你已花费数年来开发这些技能方面的专业知识,不会轻易改弦易辙。

即使并不完全确信什么是正确的方向,也要改变方向

有时候我们需要改变方向,即使我们并不确切知道新的方向是什么。最近领先的加拿大和美国AI研究人员就是这么做的。他们认为自己被误导了,需要实质上重新开始。

2f7c2bfd34441a99203f4ddec5ad1b91bf59885f

去年秋天,杰弗里•辛顿(Geoffrey Hinton)以实际行动诠释了这番感悟,他因上世纪80年代在DNN领域的开创性工作而名声大噪。辛顿现在是多伦多大学名誉教授和谷歌研究员,他表示,现在他对DNN的基础方法:反向传播“极其怀疑”。辛顿观察到人脑不需要所有那些标记的数据就能得出结论,说“我的观点是,扔掉反向传播,从头开始。”

考虑到这一点,下面简单地调查一下新方向,它们有的很靠谱,有的不太现实,但都不是对我们所知道的深度神经网络所作的渐进式改进。

描述的内容有意简短,无疑会引导您进一步阅读以求充分理解。

看起来像DNN、但实则不是的技术

有一系列研究力挺辛顿抨击反向传播的观点,认为节点和层的基本结构有用,但连接和计算的方法需要大幅修改。

胶囊网络(CapsNet)

我们先从辛顿自己目前的研究新方向CapsNet开始说起。这与CNN的图像分类有关;简单地说,问题是卷积神经网络(CNN)对于对象的姿态(pose)并不敏感。也就是说,如果识别同一对象,但是位置、大小、方向、变形、速度、反射率、色调和纹理等方面有所不同,就需要为这每一种情况添加训练数据。

在CNN中,这是通过大量增加训练数据及/或增加可以泛化的最大池化层来处理的,但完全丢失了实际信息。

96a0aeb3d2b6c43e709354aaefe5834c6a4c258b

下列描述来自CapsNets方面众多出色的技术描述之一,这个来自Hackernoon。

胶囊是一组嵌套的神经层。所以在普通的神经网络中,你不断增加更多的层。在CapsNet中,你会在一个层里面添加更多层。或者换句话说,将一个神经层嵌套在另一个神经层里面。胶囊内神经元的状态捕获图像内一个实体的上述属性。胶囊输出一个向量,表示实体的存在。向量的方向代表实体的属性。该向量被发送给神经网络中所有可能的父节点(parent)。预测向量则通过自身权重和权重矩阵相乘来计算。无论哪个父节点有最大的标量预测向量乘积,都会加大胶囊键(capsule bond),其余父节点减小胶囊键。这种采用协议路由机制(routing by agreement)的方法优于当前像最大池化这样的机制。

CapsNet极大地减小了所需的训练集,在早期测试中表明:在图像分类方面,性能更胜一筹。

gcForest

今年2月,我们介绍了南京大学新软件技术国家重点实验室的周志华和冯霁的研究成果,他们展示了一种名为gcForest的技术。他们的研究报论文显示,gcForest在文本分类和图像分类方面都经常胜过CNN和RNN。优点相当明显。

  • 只需要一小部分训练数据。

  • 在普通的台式机CPU设备上就可以运行,无需GPU。

  • 训练速度一样快,在许多情况下甚至更快,适合于分布式处理。

  • 超参数少得多,在默认设置下表现良好。

  • 依赖易于理解的随机森林,而不是完全不透明的深度神经网络。

简而言之,gcForest(多粒度级联森林)是一种决策树集成方法,深度网络的级联结构保留下来,但不透明的边缘和节点神经元被与完全随机的树森林配对的随机森林组取而代之。请了解gcForest的更多信息,请参与我们的这篇原始文章(https://www.datasciencecentral.com/profiles/blogs/off-the-beaten-path-using-deep-forests-to-outperform-cnns-and-rnn)。

Pyro和Edward

Pyro和Edward是两种新的编程语言,将深度学习框架与概率编程融合在一起。Pyro是优步和谷歌的杰作,而Edward脱胎于哥伦比亚大学,得到了美国国防高级研究计划局(DARPA)的资助。结果是,框架让深度学习系统可以测量它们对于预测或决策的信心有多大。

在经典的预测分析中,我们可能使用对数损失作为拟合函数,并惩罚自信但错误的预测(误报),以此处理这个问题。到目前为止,对于深度学习而言没有必然的结果。(So far there’s been no corollary for deep learning.)

比如说,这有望适用于自动驾驶汽车或飞机,好让控制系统在做出重大的决定之前具有某种自信或怀疑的感觉。这当然是你希望优步的自动驾驶车辆在你上车前要知道的。

Pyro和Edward都处于发展的早期阶段。

看起来不像深度网络的方法

我经常碰到一些小公司,它们开发的平台其核心使用不同寻常的算法。我发现在大多数情况下,它们一直不愿意提供足够详细的资料,好让我可以为读者描述平台算法的概况。这种保密并不影响它们的效用,但是除非它们提供一些基准数字和一些细节,否则我无法真正告诉你内部发生了什么。

目前,我研究过的最先进的非DNN算法和平台如下:

分层时间记忆(HTM)

分层时间记忆(HTM)使用稀疏分布式表示(SDR)对大脑的神经元进行建模,并执行计算,它在标量预测(商品、能源或股价等方面的未来价值)和异常检测方面的性能比CNN和RNN更胜一筹。

15ddb7aca7bb0a7c3ea6af8900cd2da2718b8ed1

这是以Palm Pilot成名的杰夫•霍金斯(Jeff Hawkins)在其公司Numenta获得的成果。霍金斯致力于搞出一种强大的AI模型,该模型基于针对大脑功能的基础研究,它不是采用DNN中的层和节点那种结构。

HTM的特点是可以非常迅速地发现模式,只需要1000次观测。相比之下,训练CNN或RNN需要观测数十万次、甚至数百万次。

此外,模式识别是无监督的,可以基于不断变化的输入实时识别模式中的变化,并推而广之。因而获得的系统不仅训练起来非常快,还具有自学习和自适应的特点,不会被数据的变化或干扰信息(noise)所困扰。

我们在2月份的文章中介绍了HTM和Numenta,建议不妨阅读一下(https://www.datasciencecentral.com/profiles/blogs/off-the-beaten-path-htm-based-strong-ai-beats-rnns-and-cnns-at-pr)。

值得一提的一些渐进式改进

我们力图关注真正改变这个领域的技术,不过渐进式改进方面至少有两个例子值得一提。这些显然仍是典型的CNN和RNN(有着反向传播的要素),但工作起来效果更好。

使用谷歌云AutoML进行网络修剪

谷歌和英伟达的研究人员使用一种名为网络修剪(network pruning)的方法,去除了并不直接影响输出的神经元,让神经网络更小巧、运行起来更高效。最近取得的这一进步缘于谷歌新的AutoML平台在性能上有了重大改进。

Transformer

Transformer是一种新颖的方法,最初在CNN、RNN和LTSM擅长的领域:语言处理(比如语言到语言的翻译)中很有用。去年夏天谷歌Brain和多伦多大学的研究人员发布了Transformer,它已在包括这项英语/德语翻译测试在内的众多测试中表明准确性有了显著提高。

7c52d1079bb121e427bc31d33aa896d0010c2a26

RNN具有顺序处理的特性,因而更难充分发挥GPU等现代快速计算设备的性能,这类设备擅长并行处理而不是顺序处理。CNN的顺序处理特性比RNN弱得多,但在CNN架构中,组合来自输入远端部分的信息所需要的步骤数量仍随距离加大而增多。

准确性方面的突破来自开发出“自注意力功能”(self-attention function),该功能将步骤显著简化为数量不多且恒定的步骤。在每个步骤,它都会运用自注意力机制,直接对句子中所有单词之间的关系建立模型,不管它们各自的位置怎样。

请阅读此处的原始研究论文(https://papers.nips.cc/paper/7181-attention-is-all-you-need.pdf)。

结束语:也许是时候转变方向了

一个不可忽视的事实是,中国正在大力投资于AI;设定的目标是,在几年内超过美国,成为全球AI领导者。

斯蒂夫•莱文(Steve LeVine)是Axios的未来栏目编辑,并在乔治城大学任教。他在撰写的一篇文章中认为,中国可能在迅速跟随,但恐怕永远赶不上。原因在于,美国和加拿大的研究人员可以随时转变方向、从头开始。制度上受导向的中国人永远没法这么做。以下内容来自莱文的那篇文章:

“在中国,那是无法想象的,”西雅图Outreach.io的首席执行官曼尼•梅迪纳(Manny Medina)说。他表示,像Facebook的雅恩•乐坤(Yann LeCun)和多伦多Vector Institute的杰夫•辛顿(Geoff Hinton)这些AI界的明星“不必征得批准。他们可以开始研究,向前推进工作。”

正如风险投资家们所说,也许是时候转变方向了。


原文发布时间为:2018-03-26

本文作者:云头条

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:【深度学习卡住了】技术缺陷根本无法解决,算法领域没有重大突破

相关文章
|
16天前
|
机器学习/深度学习 监控 算法
深度学习赋能智能监控:图像识别技术的革新与应用
【4月更文挑战第8天】 随着人工智能技术的飞速发展,深度学习在图像处理领域取得了突破性进展。特别是在智能监控系统中,基于深度学习的图像识别技术已成为提升安全和效率的关键工具。本文将探讨深度学习技术如何革新传统监控体系,增强其对复杂场景的理解能力,以及在实际部署中面临的挑战和解决方案。通过分析最新的研究成果和应用案例,我们揭示了深度学习在智能监控领域的潜力及其对未来社会发展的影响。
18 2
|
15天前
|
机器学习/深度学习 监控 安全
智能化视野下的守卫者:基于深度学习的图像识别技术在智能监控领域的革新应用
【4月更文挑战第9天】 随着人工智能技术的飞速发展,深度学习已经成为了推动计算机视觉进步的重要力量。尤其在智能监控领域,基于深度学习的图像识别技术正逐步转变着传统监控系统的功能与效率。本文旨在探讨深度学习技术如何赋能智能监控,提高对场景理解的准确性,增强异常行为检测的能力,并讨论其在实际部署中所面临的挑战和解决方案。通过深入分析,我们揭示了深度学习在智能监控中的应用不仅优化了安全防范体系,也为城市管理和公共安全提供了有力的技术支持。
|
22小时前
|
机器学习/深度学习 边缘计算 监控
深度学习赋能智能监控:图像识别技术的革新与应用
【4月更文挑战第23天】 随着人工智能的迅猛发展,深度学习技术在图像处理领域取得突破性进展,特别是在智能监控系统中,基于深度学习的图像识别已成为提升系统智能化水平的核心动力。本文旨在探讨深度学习如何优化智能监控系统中的图像识别过程,提高监控效率和准确性,并分析其在不同应用场景下的具体实施策略。通过深入剖析关键技术、挑战及解决方案,本文为读者提供了一个关于深度学习图像识别技术在智能监控领域应用的全面视角。
|
1天前
|
机器学习/深度学习 监控 安全
智能监控的革新者:基于深度学习的图像识别技术
【4月更文挑战第23天】 在智能监控领域,基于深度学习的图像识别技术已经成为一种革命性的工具。这种技术能够自动识别和分类图像中的对象,提供实时的、准确的信息,从而提高监控系统的效率和准确性。本文将探讨深度学习在图像识别中的应用,以及其在智能监控中的潜在价值。
|
2天前
|
机器学习/深度学习 数据采集 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【4月更文挑战第21天】 本文章深入探讨了深度学习技术在自动驾驶车辆图像识别领域的应用。不同于传统的摘要方式,本文将直接点出研究的核心价值和实际应用成果。我们专注于卷积神经网络(CNN)的创新设计,其在复杂道路场景下的行人和障碍物检测中的高效表现,以及这些技术如何整合到自动驾驶系统中以增强安全性和可靠性。通过实验验证,我们的模型在公开数据集上达到了行业领先水平的准确率,并且在真实世界的测试场景中展现了卓越的泛化能力。
|
4天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用研究
【4月更文挑战第20天】 本研究聚焦于深度学习技术在图像识别领域的应用,并探讨其在自动驾驶系统中的实际效用。文章首先回顾了深度学习与图像处理技术的基础知识,随后详细分析了卷积神经网络(CNN)在车辆环境感知中的关键作用。通过实验数据对比分析,本文验证了所提出算法在提高自动驾驶车辆对周围环境的识别准确性和实时性方面的有效性。最后,讨论了目前技术的局限性及未来可能的研究方向,旨在为进一步的技术突破提供参考。
|
5天前
|
机器学习/深度学习 监控 算法
深度学习驱动下的智能监控革新:图像识别技术的前沿应用
【4月更文挑战第19天】 在数字时代,智能监控系统作为城市安全和效率的守护者,正经历着前所未有的技术变革。本文深入探讨了基于深度学习的图像识别技术如何重塑智能监控领域,通过算法创新提升识别准确率,实时处理大量数据,并在各种环境条件下稳定运行。我们将分析当前最前沿的技术应用案例,探讨其在实际应用中遇到的挑战及未来发展趋势,从而为相关领域的研究者和实践者提供参考和启示。
|
5天前
|
机器学习/深度学习 传感器 人工智能
基于深度学习的图像识别技术在自动驾驶系统中的应用
【4月更文挑战第18天】 随着人工智能的快速发展,深度学习技术在图像处理和识别领域取得了显著进展。特别是在自动驾驶系统中,基于深度学习的图像识别技术已成为关键技术之一。本文将探讨深度学习在自动驾驶系统中的应用,重点关注卷积神经网络(CNN)和循环神经网络(RNN)在车辆检测、行人识别和交通标志识别等方面的应用。通过对比传统图像识别方法,我们将展示深度学习技术如何提高自动驾驶系统的准确性和鲁棒性。
|
6天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【4月更文挑战第18天】 随着人工智能的快速发展,特别是深度学习技术的突破性进步,图像识别已成为自动驾驶领域的核心组成部分。本文旨在探讨基于深度学习的图像识别技术如何优化自动驾驶系统的性能,并分析其在实时交通场景中处理复杂视觉信息的能力。文中将介绍几种主要的深度学习模型,包括卷积神经网络(CNN)和递归神经网络(RNN),以及它们在图像分类、目标检测和语义分割中的应用。同时,文章还将讨论当前技术面临的挑战和未来的发展方向。
|
6天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶汽车中的应用
【4月更文挑战第18天】 随着人工智能技术的迅猛发展,深度学习已成为推动多个技术领域革新的关键力量。尤其在图像识别领域,深度学习技术通过模仿人类视觉系统的处理机制,显著提高了机器对视觉信息的理解和分析能力。本文将探讨深度学习在图像识别领域的核心技术原理,并重点分析其在自动驾驶汽车中的应用,如何通过精确的图像识别来增强车辆的环境感知能力,从而实现更安全、更高效的驾驶体验。