线性回归
机器学习分为监督学习(或称为有监督学习)、无监督学习、半监督学习,线性回归属于监督学习。
监督学习在训练时,不仅需要将训练的数据输入计算机,还需要将与该训练数据对应的结果(标签)输入计算机。训练完成后,将测试的数据输入计算机,计算机会对测试数据的标签进行预测,例如,要完成一个能够认识小狗的算法,在使用监督学习算法时需要将小狗的照片作为训练数据输入计算机,同时还要告诉计算机这张照片结果(标签)是小狗,算法才可以进行训练。常见的监督学习算法有线性回归、逻辑回归、KNN、SVM等。
无监督学习是给计算机提供需要训练的数据,不会将数据对应的结果(标签)输入,所以计算机无法直接确定哪个数据对应着什么标签,只能通过分析数据的特征进行特征描述。常见的无监督学习算法有聚类算法、K-均值聚类算法等。
半监督学习中提供的数据,一些有标签,一些没有标签,但没有标签的数据要多于有标签的数据,通过局部特征分析,从而获取整体特征分布。