【深度学习并非万能】全方位对比深度学习和经典机器学习

简介: 深度学习已成为大多数AI问题的首选技术,使得经典机器学习相形见绌。但是,尽管深度学习有很好的性能,经典机器学习方法仍有一些优势,而且在一些特定情况下最好使用经典机器学习方法,例如线性回归或决策树,而不是使用一个大型深度网络。本文将对比深度学习和经典机器学习,分别介绍这两种技术的优缺点。

近年来,深度学习已成为大多数AI问题的首选技术,使得经典机器学习相形见绌。原因很明显,深度学习在语音、自然语言、视觉和游戏等许多任务上都表现出卓越的性能。然而,尽管深度学习具有如此好的性能,经典机器学习方法仍有一些优势,而且在一些特定情况下最好使用经典机器学习方法,例如线性回归或决策树,而不是使用一个大型深度网络。

本文将对比深度学习和经典机器学习,分别介绍这两种技术的优缺点以及它们在哪些问题/如何得到最佳使用。

深度学习优于经典机器学习

516da44af08d4b7ad8ff0551f9d5d5d2ca225106一流的性能: 在许多领域,深度网络已经取得了远远超过经典ML方法的精度,包括语音、自然语言、视觉、游戏等。在许多任务中,经典的ML方法甚至无法与深度学习比较。例如,下图显示了ImageNet数据集上不同方法的图像分类精度;蓝色表示经典ML方法,红色表示深度卷积神经网络(CNN)方法。深度学习方法的分类错误率远远低于经典ML方法。
f56b2db5f54559f0d3539b817dc84ef998744a45

516da44af08d4b7ad8ff0551f9d5d5d2ca225106用数据进行有效的扩展: 与经典ML算法相比,如果有更多的数据,深度网络可以更好地扩展。下图是一个简单的例子。很多时候,用深度网络来提高准确性的最佳建议就是使用更多的数据!但使用经典ML算法时,这种快速简单的方法几乎没有效果,通常需要更复杂的方法来提高精度。
908fb71c504e2ac164463c48deb2ecc2eb2fcd40

516da44af08d4b7ad8ff0551f9d5d5d2ca225106不需要特征工程: 经典的ML算法通常需要复杂的特性工程。通常,需要先在数据集上执行探索性数据分析。然后,可以降低维度以便于处理。最后,必须仔细选择最佳的特征,以传递给ML算法。在使用深度学习时,不需要这样的特征工程,因为只需将数据直接传递给网络,通常就可以立即实现良好的性能。这完全消除了整个过程中繁重而且很有挑战性的特征工程阶段。
516da44af08d4b7ad8ff0551f9d5d5d2ca225106适应性强,易于迁移: 与经典的ML算法相比,深度学习技术可以更容易地适应不同的领域和应用。首先,迁移学习可以使预训练的深度网络对同一领域的不同应用生效。例如,在计算机视觉中,预训练的图像分类网络通常用作目标检测和分割网络的特征提取前端。将这些预训练的网络作为前端,可以简化整个模型的训练,并且通常有助于在更短的时间内实现更高的性能。

此外,不同领域使用深度学习的基本思想和技术往往是可以转移的。例如,一旦了解了语音识别领域的深度学习基础理论,那么学习如何将深度网络应用于自然语言处理就不太困难了,因为两者所需的基础知识非常相似。但对于经典ML来说,情况并非如此,因为构建高性能ML模型需要特定领域和特定应用的ML技术和特征工程。对于不同的领域和应用,经典ML的知识基础是非常不同的,并且往往需要在每个单独的领域进行广泛的专门研究。

经典机器学习优于深度学习

516da44af08d4b7ad8ff0551f9d5d5d2ca225106在小数据上能更好地工作: 为了实现高性能,深度学习需要非常大的数据集。之前提到的预训练的网络在120万张图像上进行了训练。对于许多应用来说,这样大的数据集是不容易获得的,花费昂贵而且耗时。对于较小的数据集,经典的ML算法通常优于深度学习。
516da44af08d4b7ad8ff0551f9d5d5d2ca225106财务和计算上都更便宜: 有大量的数据,又需要在合理时间内训练完,深度学习要求使用高端GPU。这些GPU非常昂贵,但是如果没有它们,就很难实现高性能的深度网络。要有效地使用这样的高端GPU,还需要一个快速的CPU、SSD存储、快速而且容量大的RAM。经典的ML算法只需要一个像样的CPU就可以训练得很好,并不需要最好的硬件。因为它们的计算成本不高,因此可以在较短的时间里更快地迭代,并尝试多种不同的技术。

516da44af08d4b7ad8ff0551f9d5d5d2ca225106更容易解释:由于经典ML涉及直接的特征工程,这些算法很容易解释和理解。此外,由于我们对数据和底层算法有了更深入的了解,调参和更改模型设计也更简单。另一方面,深层学习是一个“黑盒子”,即使是现在,研究人员也不能完全了解深层网络的“内部”。由于缺乏理论基础,超参数和网络设计也是一个很大的挑战。


原文发布时间为:2018-04-6

本文作者:George Seif

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:【深度学习并非万能】全方位对比深度学习和经典机器学习

相关文章
|
机器学习/深度学习 人工智能 安全
探索AI的未来:从机器学习到深度学习
【10月更文挑战第28天】本文将带你走进AI的世界,从机器学习的基本概念到深度学习的复杂应用,我们将一起探索AI的未来。你将了解到AI如何改变我们的生活,以及它在未来可能带来的影响。无论你是AI专家还是初学者,这篇文章都将为你提供新的视角和思考。让我们一起探索AI的奥秘,看看它将如何塑造我们的未来。
362 3
|
6月前
|
机器学习/深度学习 人工智能 供应链
从概念到商业价值:AI、机器学习与深度学习全景指南
在这个科技飞速发展的时代🚀,人工智能正以惊人的速度渗透到我们的生活和工作中👀。但面对铺天盖地的AI术语和概念,很多人感到困惑不已😣。"AI"、"机器学习"、"深度学习"和"神经网络"到底有什么区别?它们如何相互关联?如何利用这些技术提升工作效率和创造价值?
|
11月前
|
机器学习/深度学习 人工智能 算法
探索机器学习:从线性回归到深度学习
本文将带领读者从基础的线性回归模型开始,逐步深入到复杂的深度学习网络。我们将通过代码示例,展示如何实现这些算法,并解释其背后的数学原理。无论你是初学者还是有经验的开发者,这篇文章都将为你提供有价值的见解和知识。让我们一起踏上这段激动人心的旅程吧!
209 3
|
机器学习/深度学习 人工智能 TensorFlow
基于TensorFlow的深度学习模型训练与优化实战
基于TensorFlow的深度学习模型训练与优化实战
540 3
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
440 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
11月前
|
机器学习/深度学习 人工智能 算法
机器学习与深度学习:差异解析
机器学习与深度学习作为两大核心技术,各自拥有独特的魅力和应用价值。尽管它们紧密相连,但两者之间存在着显著的区别。本文将从定义、技术、数据需求、应用领域、模型复杂度以及计算资源等多个维度,对机器学习与深度学习进行深入对比,帮助您更好地理解它们之间的差异。
|
机器学习/深度学习 自然语言处理 语音技术
探索机器学习中的深度学习模型:原理与应用
探索机器学习中的深度学习模型:原理与应用
321 0
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
523 14
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
下一篇
oss云网关配置