监督学习算法(Supervised Learning Algorithm):训练含有很多特征的数据集,不过数据集中的每个样本都有一个标签(Label)或目标(Target)。
无监督学习算法(Unsupervised Learning Algorithm):训练含有很多特征的数据集,但是数据集中所有样本都没有标签,通过无监督学习算法机器可以学习到数据特征中的内在关系。
自监督学习算法(Self-Supervised Learning Algorithm):近几年兴起的学习方法,当数据集中只有数据的特征,没有标签时,依然可以通过某些方法来 “制造”标签进行监督式学习。
监督的理解:监督学习中教员或者老师提供标签给机器学习系统,指导其应该做什么。在无监督学习中,没有教员或者老师,算法必须学会在没有指导的情况下理解数据的内在特征。
监督/非监督并非是严格分类的。很多机器学习技术会组合使用。
半监督学习(Semi-Supervised Learning):在一个任务中,试图让学习器自动地对大量未标记数据直接帮助少量有标记数据进行模型训练。
强化学习(Reinforcement Learning):学习系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统如何去产生正确的动作。