1.1欢迎
1.2机器学习是什么
(1)一种机器学习的定义:一个程序被认为能从经验E中学习,解决任务T,达到性能指标度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。
(2)机器学习算法主要分为监督学习和非监督学习。监督学习是我们将教计算机如何去完成任务,非监督学习是我们打算让计算机它自己去学习。此外还有强化学习和推荐系统等其他机器学习。
(3)本课程主要内容是监督学习、非监督学习、了解应用机器学习算法的实用建议。
1.3监督学习
(1)监督学习基本思想是我们数据集中的每个样本都有相应的“正确答案”(有标签)。再根据这些样本做出预测,像房子和肿瘤的例子。
(2)监督学习分为回归问题和分类问题,前者如房价的预测,将房价的一系列实数值看成是连续的,后者如肿瘤预测,分为良性和恶性两种类别,其取值看成是离散的。
回归问题
分类问题
1.4无监督学习
(1)无监督学习样本没有标签(“无正确答案”),无监督学习算法可能会把没有标签的数据分成不同的簇,这种算法较聚类算法。
(2)一些常见的聚类算法应用:新闻分类、基因学的理解应用、组织大型计算机集群、社交网络分析、市场分割、天文数据分析等。