机器学习的主要任务就是利用算法进行学习,其思想就是就是通过对数据进行训练、然后用训练得到的模型对目标任务进行预测。传统的机器学习根据是否对训练数据进行标注大致分成有监督学习以及无监督学习的两种方法。有监督学习指的是在训练时,不仅仅输入原始的训练时据,同时输入的还有在数据上打的标签。当模型训练学习完之后,在测试时输入测试集里面的数据,这部分数据是不带标签的,测试完成模型会输出这部分数据的运行结果。无监督学习与监督学习不同,输入模型的是不带标签的原始数据,因此,模型只能依靠自己的计算能力对数据的特征进行分析。而深度学习是机器学习的子集,相比较传统的机器学习,可以更加智能地进行学习以及决策。
深度学习的出现是对神经网络的不断研究后开始的,绝大部分的深度学习方法采用的也是神经网络的结构,上文提到的多层神经元网络可以算作其中的一种。本质上深度学习是模拟人脑的学习机制而诞生的方法,其主要思想是通过学习来找出任务的特征,以进一步进行识别、检测等任务。深度学习会通过不同的卷积、池化等操作,来对输入的低层和高层特征进行学习。深度学习与机器学习的关系是深度学习可以说是机器学习里面的一个新的研究领域,可以看成是机器学习的一种特殊的方式,也相当于是机器学习的升级版本。因此,相对于传统的机器学习来说,深度学习在精度方面大大提高。
深层次的特征与浅层次的特征相比,对任务的总体全局上的特征有着更精确的反应,深度学习的一个特点是可以得到更深层次的特征。对于特征处理方面,在传统的机器学习里面,往往是通过有经验的人手工进行标注的,但是,这样做的一个缺点是,很依赖于人工的判断,容易造成失误。同时,人工设计特征也会耗费巨额的时间,在机器学习网络里涵盖的参数中,很多都需要人为地调整,数量级也比深度学习小了很多。
在深度学习中,对人体视觉系统模拟的特征提取过程是采用多个网络层来实现的,大概可以分为下面几步。第一步,位于网络前面的隐藏层可以对图像的边缘的特征进行学习;第二步,位于中间的隐藏层可以对边缘特征集合形成的物体外形的特征进行学习,还可以对外形特征集合而形成的图案的特征来进行学习;第三步,位于最末尾的隐藏层可以对图案集合而形成的待识别物体的特征进行学习。同样的,不只是视觉信息,其它类型的处理过程同样也与此类似。
因此,相比起对浅层的学习,深度学习具备更加强大的识别能力,在深度学习的网络中,包含了各种各样的层结构,这样做的优点是,相比较层数更少的神经网络来说,深层次的网络在数据量较大、目标任务表层特征不明显的应用场景时,可以更精确地提取到目标的特征。