1统计学习及监督学习概论

简介: 笔记

1.1 统计学习


统计学习方法的步骤

得到一个有限的训练数据集合

确定学习模型的集合

确定模型选择的准则

实现求解最优模型的算法

通过学习方法选择最优模型

利用学习的最优模型对新数据进行预测或分析


1.2 统计学习方法的分类


基本分类

监督学习

无监督学习

强化学习

按模型分类

概率模型和非概率模型

线性模型和非线性模型

参数化模型和非参数化模型

按技巧分类

贝叶斯学习

核方法

按算法分类

在线学习

批量学习


1.2.1 基本分类

监督学习:


监督学习(Supervised learning) 是指从标注数据中学习预测模型的机器学习问题,其本质是学习输入到输出的映射的统计规律


输入空间


输入的所有可能取值的集合


实例(instance)


每一个具体的输入,通常由特征向量(Feature vector)表示


特征空间


所有特征向量存在的空间


输出空间


输出的所有可能的集合


根据变量类型的不同:


输入变量与输出变量为连续变量的预测问题 回归问题

输出变量为有限个离散变量的预测问题 分类问题

输入变量与输出变量均为变量序列的预测问题 标注问题

监督学习的基本假设:X  和 Y  具有联合概率分布 P(X,Y)


监督学习的目的:学习一个输入到输出的映射,这一映射以模型表示


模型的形式:条件概率分布P(Y∣X)或决策函数 Y=f(X)


假设空间:所有这些可能模型的集合


监督学习的流程图:



模型的形式:条件概率分布P(Y∣X)或决策函数 Y=f(X)


假设空间:所有这些可能模型的集合


监督学习的流程图:

21.png


目录
相关文章
|
8月前
|
机器学习/深度学习 数据采集 运维
深入乳腺癌谜团:无监督学习与R语言的勘探之旅
本文旨在进一步探讨无监督学习和R语言在乳腺癌研究中的应用。通过引用相关文献的支持,我们将深入探讨无监督学习和R语言在乳腺癌研究中的具体应用案例,并讨论它们是如何提高我们对乳腺癌的理解和诊断的。
115 0
|
8月前
|
机器学习/深度学习 自然语言处理 算法
【机器学习】十大算法之一 “朴素贝叶斯”
朴素贝叶斯算法是一种监督学习的算法,通过计算条件概率来预测或分类数据。它的核心思想是贝叶斯定理,即后验概率等于先验概率与似然函数的乘积除以证据因子。在文本分类的应用中,假设我们有一个文档和一个文档分类,我们想要判断这个文档属于哪个分类。我们可以将文档中的每个词都看作一个特征,每个特征的值为 0 或 1,0 表示该词不在文档中,1 表示该词在文档中。这样,我们就可以将每个文档表示为一个特征向量。然后,我们可以使用朴素贝叶斯算法来计算每个分类的条件概率,并选择条件概率最大的分类作为文档所属的分类。
225 0
【机器学习】十大算法之一 “朴素贝叶斯”
|
10月前
|
机器学习/深度学习 自然语言处理 Python
机器学习系列 | 03:从朴素贝叶斯和HMM说起
本系列博文尝试系统化地梳理概率图模型。本文以朴素贝叶斯和HMM为切入点尝试窥探概率图模型一二。
|
10月前
|
机器学习/深度学习 存储 人工智能
自监督学习技术综述
自监督学习技术综述
272 0
|
11月前
|
机器学习/深度学习 DataX C++
机器学习入门详解(一):理解监督学习中的最大似然估计
 这篇文章在统计学的背景下对机器学习学习建模过程进行了解密。将带你了解如何对数据的假设使我们能够创建有意义的优化问题。事实上,我们将推导出常用的标准,如分类中的交叉熵和回归中的均方误差。
104 0
机器学习入门详解(一):理解监督学习中的最大似然估计
|
机器学习/深度学习 自然语言处理 算法
半监督学习|深度学习(李宏毅)(九)
半监督学习|深度学习(李宏毅)(九)
461 0
半监督学习|深度学习(李宏毅)(九)
|
机器学习/深度学习 算法 BI
机器学习:李航-统计学习方法笔记(一)监督学习概论
机器学习:李航-统计学习方法笔记(一)监督学习概论
138 0
机器学习:李航-统计学习方法笔记(一)监督学习概论
|
机器学习/深度学习 存储 传感器
入坑机器学习:二,监督学习
第三个问题是输入空间的维数。如果输入特征向量具有非常高的维数,学习问题是很困难的,即使真函数仅依赖于一个小数目的那些特征。这是因为许多“额外”的尺寸可混淆的学习算法,并使其具有高方差。因此,高的输入维数通常需要调整分类器具有低方差和高偏置。在实践中,如果工程师能够从输入数据手动删除不相关的特征,这是有可能改善该学习功能的准确性。此外,还有许多算法的特征选择,设法确定相关特征,并丢弃不相关的。这是维数降低,其目的是将输入数据映射到较低维空间中运行的监督学习算法之前的更一般的策略的一个实例。
119 0
入坑机器学习:二,监督学习
|
机器学习/深度学习 存储 算法
入坑机器学习:三,非监督学习
不同于监督学习的数据的样子,即无监督学习中没有任何的标签或者是有相同的标签或者就是没标签。所以我们已知数据集,却不知如何处理,也未告知每个数据点是什么。别的都不知道,就是一个数据集。你能从数据中找到某种结构吗?针对数据集,无监督学习就能判断出数据有两个不同的聚集簇。这是一个,那是另一个,二者不同。是的,无监督学习算法可能会把这些数据分成两个不同的簇。所以叫做聚类算法。
124 0
入坑机器学习:三,非监督学习
|
机器学习/深度学习 知识图谱
基于强化学习的可解释性推荐 文献三篇
基于强化学习的可解释性推荐 文献三篇