人工智能最近几年可谓是异常的火爆,国家人工智能的人才缺口相当大,因此很多高校该专业的应届毕业生的薪资也高的离谱,下面就是2018届互联网校招的高薪清单:
面对如此之高的薪资,很多人都急于投入人工智能的学习,而机器学习则是人工智能的基础,因此有必要先了解什么是机器学习,并学习机器学习的相关算法。
1 引言
在介绍机器学习的相关概念之前,我们先来看几个简单的案例。
首先我们来看一个小学的数学填空题,题目如下:
请在空白处填上正确的数字。
2 4 ( ) 8 10
这个题目应该只有小学数学的水平,相信各位同学一定毫无压力,我们会快速的得到答案是:6。
那么问题来了,为什么答案是6呢?
我们将上述的形式,换一种写法,如下:
x 1 2 3 4 5
y 2 4 ? 8 10
其中x表示当前是第几个数,如第1个数就是2,第2个数是4,以此类推,而我们要计算的就是第3个数是多少。通过对上表的观察,我们得到y和x之间存在某种映射关系,即y = f(x) = 2·x,有了这种映射关系之后,我们就能够很快的计算第3个位置的数是多少,即将x=3代入到函数中,即可得到y = f(3) = 2 · 3 = 6。
通过上面的案例介绍,我们可以得出这样的结论,当我们知道了自变量x和因变量y之间的映射关系之后,就可以很快的预测其他自变量x所对应的因变量y的值。因此映射关系显得格外重要,如果通过观察我们不能快速的得到这种关系,那么此题做起来将会变得非常麻烦。
但是很多时候,我们并不能通过简单的观察就能准确的知道这个映射关系是什么?
接下来我们来看另外一个稍微复杂的案例。
这是一个关于房价和面积之间的数据,其中x表示的是平方英尺,y是价格。如果此时要让你去填500平方英尺对应的房价是多少,相信你此时会比较犹豫,这个题目就没有上面那个题目容易计算了,原因就在于我们不知道这个映射关系是什么。
我们想要去计算结果,那么前提就是要知道这种映射关系,但是我们又不知道这种映射关系是什么,因此只有靠机器自己去学习到这种函数是什么,当有了函数之后,就可以计算结果了。
世间有千千万万的函数,那么本题应该是什么函数呢?机器的目的就是要从这些千千万万的函数中,学习到本题所对应的函数。这将是一个漫长的过程,但是机器一旦学习到了这种函数,将会变得异常的强大,此时你任意给一个自变量,都会得到对应的因变量的值。
接下来我们再看一个文本的案例。
我们平时在看一些新闻网站的时候,经常都会根据新闻所属的分类来阅读自己感兴趣的新闻。
假如我们现在要让计算机去做新闻分类这件事,给你一个新闻,然后计算机告诉我当前新闻属于哪个类别?
【历史】《清明上河图3.0》:一朝步入画卷 一日梦回千年
【历史】1978年对越作战在即 许世友却为何每日沉迷打猎
【军事】距中国"最后通牒"仅20天 印度迅速变卦配合要求
【军事】美军购买俄罗斯超音速反舰导弹 研究如何对抗中俄
【军事】海军052B驱逐舰进坞引发联想 要改成大号054A?
根据上面的这些信息,此时再让你来做一道填空题
"蒋经国送张学良何物 张坚持服用50年活过百岁" 所属新闻类别是:( )
这种填空题如果人类来做的话,应该还是比较简单,但是如何让机器来做呢?
按照之前的思路,如果机器来做的话,就一定要知道这种新闻标题和新闻类别之间的映射关系,即:
f('新闻标题') = 新闻类别。
而一旦这种映射关系有了之后,我们需要做的只是简单的代入到这个函数,就可以得到结果:
f('蒋经国送张学良何物 张坚持服用50年活过百岁') = '历史'
f('如果96年武统 解放军面临的最大威胁是什么') = '军事'
最后,我们来看一个关于图片的例子。
我们想要让计算机来进行动物分类,如:
这是一只猫。
此时就需要计算机去学习到这种图片的映射关系,即:
f(图片) = 动物类别
有了这种映射关系之后,你再给机器任何的图片,它都能根据这种关系进行计算,如:
f() = 狗
f() = 猫
2 传统算法和机器学习算法的区别
传统的算法是我们人类直接告诉计算机应该遵守什么样的规则,应该按照什么样的映射函数进行计算,但是非常遗憾,很多时候我们人类并不清楚这些映射关系是什么?而机器学习的魅力就在于我们人类事先并不知道这种映射关系是什么,需要让机器自己来学习这种映射关系,有了这种关系之后,就可以进行计算,进行预测了。
3 总结
通过上面的介绍,大家应该了解了什么是机器学习,机器学习和传统算法的区别是什么,以及机器学习的魅力所在。在我们现实世界中,人类不可能了解所有的自然界的规则,不可能知晓所有的函数映射关系,因此我们需要计算机来帮助我们更好的理解世界,发现世界的规律,发现世界的映射关系。因此机器学习的核心就是学习到自然界的各种映射关系,即学习到各种函数。这才是机器学习的核心所在。
那么机器如何从千千万万的函数中,找到正确的函数呢?预知后事如何,欢迎持续关注。