一、引言
1. 监督学习
- 定义:监督学习(Supervised Learning) 是给算法一个数据集,其中包含了很多案例,每个数据都是给定了明确的类别,目的是让机器可以预测出更多的正确答案。
- 案例
(1)房价预测
回归问题(Regression)
能够通过给定的数据集得到一条拟合的曲线,在这上面的值都是连续的。
(2)乳腺癌预测
分类问题(Classification)
能够通过给定的数据集,去预测离散值,其中的特征可以包括多种,不局限于两种。
2. 无监督学习
- 定义:无监督学习(Unsupervised Learning) 是根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题。
聚类算法(Clustering)
通过没有标记类别未知的数据集,将数据进行分类。
鸡尾酒舞会算法(Coktail Party Algorithm)
从混杂的语音中,提取出不同的声音来源。