- 机器学习:
-
简单的说就是机器拥有了学习能力。这又是怎么一回事呢?
再回到人工智能的例子,只不过有所变动,我们知道,现在房价的波动有一定的规律,并感觉与年份、房间数有关,并认定规则为:房价=年份*a+房间数*b。
可以问题是a和b两个参数不得而知。但是可喜的是我们有很多历史数据。于是聪明的人们就想到有没有办法用数学来解这题。题目为:已知很多数据(房价,年份,房间数),设规则为房价=年份*a+房间数*b,求解参数a,b。
的确有办法,这个领域就叫机器学习!
这里会存在2个过程,第一个过程,利用数据和规则,求得参数,我们称之为训练模型。其中的模型就是我们设定的规则。
第二个过程是,有了参数,再结合模型(公式)进行预测。也就是实际使用或叫利用机器学习。
- 这就是机器学习的基本原理,于是以下几个零星点探讨下:
- 1.数据量越大,训练的模型就越准确。
-
a)客户曰:帮我做个机器学习吧。问:多少数据量?答曰:500条——你在逗我吧。。。
2.模型有时称为怪兽,我们需要喂粮食给它。它的粮食就是数据。
3.给它吃好的,想必出的结果也好。给它喂点垃圾数据,想要好的结果怎么可能。
4.模型参数是训练出来的,那这个模型呢怎么得来?
——由工程师根据经验定义出来。于是实际过程中,需要不断的调整模型,比如上式的模型有可能是:房价=年份2*a+房间数*b。
5.怎么知道一个模型好坏?可以用训练出来的模型反过来把所有训练数据预测一遍,比较与真实值之间的差别,就知道准确率了。
6.机器学习工作者主要工作就是寻找训练数据,然后不断调整模型,让训练结果更OK。
7.机器学习常见解决几类问题:
a)预测值为连续的,比如房价,那这类问题称为回归,可以作预测一些数值类的。
b)预测值为离散的,比如性别,花的类别,业务办理部门,这类问题可以称为分类。可以实现对数据的分类预测。
c)一些是没有预测值的,比如一堆文件,我们可以用机器学习进行聚类,把有一定规律的放在一块,然后再由人看了找规律。
d)a和b称为监督学习,c称为非监督学习。