(1)有数据集 和 没有数据集区别
[1] 有监督学习的目的是在训练集中找规律,然后对测试数据运用这种规律,然后在预测未来的事件。
[2] 无监督学习没有训练集,只有一组数据,在该组数据集内寻找规律。
(2)预测y值 和 找规律区别
[1] 有监督学习要实现的目标是“对于输入数据X能预测变量Y”(有答案和方法的学)。
[2] 无监督学习要回答的问题是“从数据X中能发现什么”(自学)。
(3)模型评估选择 使不使用区别
[1] 有监督学习需要设计到模型评估\模型比较\模型选择
[2] 无监督学习一般比较少
(4)难易程度区别
[1] 有监督的操作会相比无监督步骤多点。没有训练集等,以及模型评估也用的比较少。
[2] 无监督的操作会容易一点。
(5)对象所属类别 是否提前分类区别
[1] 有监督学习-分类算法是把 "某个对象" 划分到某个具体的 "已经定义的类别" (分类的类别是提取预定义的)
[2] 无监督学习-聚类算法是把 "所有对象" 按照具体特征组织 "拆分到若干个类别" (分类别却不是提取预定义的)
(6)新来的对象模型是否打乱问题
[1] 有监督学习-分类算法,是存在训练集, 才会有对真实的数据预测。每来一个对象会套进模型,就得到了分类结果。
所以新来的对象不会干扰的原来的模型。
[2] 无监督学习-聚类算法,是吧每来一个或多个对象都可能打乱的模型,然后对分类重开始新的拆分计算。