@TOC
一、数据相关术语
- 数据集
对于实际问题中的记录构成的集合
- 学习(训练)
从数据中学得模型的过程,也就是机器学习的主要目的
- 样本特征向量
一般一条记录有多个属性构成,将多个属性表示成向量,称为样本的特征向量(feature vector)
- 维度
描述一个样本的属性数,称为维度
- 训练样本
训练过程中使用的数据称为训练样本
二、学习相关术语
- 分类
模型预测的是离散值
- 回归
模型预测的是连续值
- 聚类
自动对样本以一定的处理过程对其进行聚类,可能会形成一些潜在概念的分类,是一种无监督学习
- 监督学习
训练数据有标记信息
- 无监督学习
训练数据没有标记信息
- 懒惰学习
训练阶段仅仅将样本保存起来,训练时间开销为零,待收到测试样本后再进行处理
- 急切学习
在训练阶段就进行处理的方法
三、结语
其实机器学习主要的任务就两个,分类和回归,各种算法本质上都是为了提高准确率