1.5 小结
一言以蔽之,机器学习就是人类定义一定的计算机算法,让计算机根据输入的样本和一些人类的干预来总结并归纳其特征与特点,并用这些特征和特点与一定的学习目标形成映射关系,进而自动化地做出相应反应的过程。这个反应可能是做出相应的标记或判断,也可能是输出一段内容——图片、程序代码、文本、声音,而机器自己学到的内容我们可以描述为一个函数、一段程序、一组策略等相对复杂的关系描述。
在我看来,机器学习是大数据的一个子范畴。因为凡是基于对客观事物的量化认知的科学都是数据科学的范畴,也就是广义的大数据的范畴。机器学习作为其中一个用来自动归纳和总结数据关系的总的方法论当然算其中的一个子范畴,这点没有什么疑问。
而就机器学习作为研究对象来说,也有传统的机器学习和深度学习两个粗略的分类方式,我们在这里还是要提一下。它们有个比较大的区别,那就是传统的机器学习通常是需要人提前先来做特征提取,把提取过的特征向量化后再丢给模型去训练,这里人要做相当的前置工作。而深度学习通常可以采用End-to-End的学习方式,输入的内容只需要做很少的一些归一化(normalization)、白化(whitening)等处理就可以丢给模型去训练,通常不需要人来做特征提取的工作。而这个特征提取的动作可以由整个深度学习的网络模型帮我们自动完成,这就给很多传统机器学习中很难处理的问题带来了新的转机。