机器学习:李航-统计学习方法笔记(一)监督学习概论

简介: 机器学习:李航-统计学习方法笔记(一)监督学习概论

1.1统计学习

4ef4fe4e825d429abb17986566662db8.png


统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。也可以说统计学习就是计算机系统通过运用数据及统计方提高系统性能的机器学习。故统计学习也称为统计机器学习。


统计学习的目的在于从假设空间中选取最优模型。


统计学习的对象是数据,数据分为由连续变量和离散变量表示的类型,其中同类数据是指具有某种共同性质的数据。在统计学习的过程中,以变量或者是变量组表示数据。


统计学习的方法是基于数据构建统计模型从而对数据进行预测与分析。


统计学习方法包括模型的假设空间、模型选择的准则以及模型学习的算法。统计学习方法的三要素:模型、策略、算法        


统计学习由监督学习(supervised learning)、非监督学习(unsupervised learning)、半监督学习(semi-supervised learning)和强化学习(reinforcement learning)等组成。


1.2统计学习的分类


1.2.1基本分类


统计学习可以基本分类分为监督学习、无监督学习、强化学习、半监督学习、主动学习等。


  • 监督学习定义:


从标注数据中学习预测模型的机器学习问题,标注数据表示输入输出的对应关系,预测模型对给定输入产生相应的输出

本质:学习输入到输出的映射的统计规律


相关概念:


输入空间(input space):输入的所有可能的取值集合

输出空间(output space):输出的所有可能的取值集合

实例(instance):每个具体的输入,可由特征向量(feature vector)表示

特征空间(feature space):所有的特征向量存在的空间,特征空间中的每一维对应一个特征,特征空间是模型实际定义位置

假设空间:由输入空间到输出空间的映射的集合。

任务分类:


回归问题:输入变量和输出变量均为连续变量的预测问题。

分类问题:输出变量为有限个离散变量的预测问题。

标注问题:输入变量和输出变量均为变量序列的预测问题。

联合概率分布


监督学习假设输入与输出的随机变量X和Y遵循联合概率分布P(X,Y)。

P(X,Y)表示分布函数或分布密度函数,P(x,y)=P(X=x and Y=y)。

统计学习假设数据存在一定的统计规律,X和Y具有联合概率分布就是监督学习关于数据的基本假设。

对于学习系统来说,联合概率分布是未知的。

训练数据和测试数据被看作是依联合分布概率分布P(X,Y)独立同分布产生的。

假设空间


监督学习目的是学习一个由输入到输出的映射,称为模型

模式的集合就是假设空间(hypothesis space)

概率模型:条件概率分布P(Y|X), 决策函数:Y=f(X)

问题形式化


1717d417cffa4a53b2e5e2d2e7dd9e82.png


无监督学习

定义


从无标注数据中学习预测模型的机器学习问题

无标注数据表示自然得到的数据。预测模型表示数据的类别、转换或概率

本质:学习数据中的统计规律或潜在结构

问题形式化


41f3ac74e67d487e8adb85904f33caf6.png


强化学习

定义


指智能系统在与环境的连续互动中学习最优行为策略的机器学习问题。

本质:学习最优的序贯决策

假设智能系统与环境的互动基于马尔代夫决策过程,智能系统观测到的时环境互动得到的数据序列。

强化学习的马尔可夫决策过程是状态、奖励、动作序列上的随机过程,由五元组<S,A,P,r,γ>组成。

S是有限状态(state)的集合

A是有限动作(action)的集合

Р是状态转移概率(transition probability)函数:


f0d99198671f41d2919910dee4ef5344.png

r是奖励函数(reward function) :

106d621a099d4d3e9fa8eb138aff94bd.png

γ是衰减系数(discount factor ) : γ ∈ [0,1]

1467b1d198454457936afeea438298f8.png


马尔可夫决策过程具有马尔可夫性,下一个状态只依赖于前一个状态与动作,下一个奖励依赖于前一个状态与动作。

afbb5d88fecc49d79bc60ac00a41ab15.png


强化学习方法

无模型(model-free)

基于策略(policy-based):求解最优策略π*

基于价值(value-based):求解最优价值函数

有模型(model-based)

1. 通过学习马尔可夫决策过程的模型,包括转移概率函数和奖励函数

2. 通过模型对环境的反馈进行预测

3. 求解价值函数最大的策略π*


半监督学习


少量标注数据,大量未标注数据

利用未标注数据的信息,辅助标注数据,进行监督学习

较低成本

主动学习

机器主动给出实例,教师进行标注

利用标注数据学习预测模型


1.2.2按模型分类


概率模型和非概率模型

概率模型:决策树、贝叶斯网络、马尔科夫随机场、条件随机场、概率潜在语义分析、潜在狄利克雷分配、高斯混合模型


非概率模型:感知机、支持向量机、k近邻、AdaBoost、K均值、潜在语义分析、神经网络


线性模型和非线性模型

参数化模型和非参数模型


1.2.3按算法分类


统计学习模型根据算法分为在线学习和批量学习。


45f8de26321442e5abf9962e2949f5f9.png


在线学习(online learning):每次接受一个样本,进行预测,之后学习模型,并不断重复该操作的机器学习 。

批量学习(batch learning):一次接受所有的样本,学习模型,之后进行预测。


1.2.4按技巧分类


贝叶斯学习(Bayesian learning)

核方法(kernel method)


1.3统计学习的三要素


上面说到统计学习方法都是由模型、策略和算法构成的,所以三要素可以简单的表示为以下形式:


方法=模型+策略+算法


模型

模型就是所要学习的条件概率分布或者决策函数。


策略

损失函数:损失函数度量模型一次预测的好坏。

风险函数:风险函数度量平均意义下模型预测的好坏。

损失函数可以有以下几种:


6efb75ba54a2431286256ab9517d728e.png


损失函数值越小,模型就越好,学习的目标就是选择期望风险最小的模型。

监督学习的两个基本策略:经验风险最小化和结构风险最小化

经验风险或经验损失:模型f(X)关于训练数据集的平均损失

经验风险最小的模型是最优的模型,当样本容量足够大时,经验风险最小化能保证有很好的学习效果;当样本容量很小时,会产生“过拟合”现象。

结构风险最小化是为了防止过拟合而提出来的策略。


算法


统计学习方法总结为最优化问题。


算法是指线性模型的具体计算方法。


目录
相关文章
|
12天前
|
机器学习/深度学习 分布式计算 算法
联邦学习是保障数据隐私的分布式机器学习方法
【6月更文挑战第13天】联邦学习是保障数据隐私的分布式机器学习方法,它在不暴露数据的情况下,通过在各设备上本地训练并由中心服务器协调,实现全局模型构建。联邦学习的优势在于保护隐私、提高训练效率和增强模型泛化。已应用于医疗、金融和物联网等领域。未来趋势包括更高效的数据隐私保护、提升可解释性和可靠性,以及与其他技术融合,有望在更多场景发挥潜力,推动机器学习发展。
23 4
|
6天前
|
机器学习/深度学习 人工智能 算法
【机器学习】RLHF:在线方法与离线算法在大模型语言模型校准中的博弈
【机器学习】RLHF:在线方法与离线算法在大模型语言模型校准中的博弈
210 6
|
5天前
|
机器学习/深度学习 算法 BI
机器学习笔记(一) 感知机算法 之 原理篇
机器学习笔记(一) 感知机算法 之 原理篇
|
7天前
|
机器学习/深度学习 算法 搜索推荐
机器学习方法之强化学习
强化学习是一种机器学习方法,旨在通过与环境的交互来学习如何做出决策,以最大化累积的奖励。
26 2
|
7天前
|
机器学习/深度学习 搜索推荐
解决冷启动问题的机器学习方法和一个简化的代码示例
解决冷启动问题的机器学习方法和一个简化的代码示例
|
8天前
|
机器学习/深度学习 数据采集 运维
无监督学习是机器学习的一种重要方法
无监督学习是机器学习的一种重要方法
|
8天前
|
机器学习/深度学习 算法 TensorFlow
强化学习是一种通过与环境交互来学习最优行为策略的机器学习方法。
强化学习是一种通过与环境交互来学习最优行为策略的机器学习方法。
|
11天前
|
机器学习/深度学习 算法
机器学习方法分类
【6月更文挑战第14天】机器学习方法分类。
22 2
|
12天前
|
机器学习/深度学习 算法 Python
介绍文本分类的基本概念、常用方法以及如何在Python中使用机器学习库进行文本分类
【6月更文挑战第13天】文本分类是机器学习在数字化时代的关键应用,涉及文本预处理、特征提取和模型训练等步骤。常见方法包括基于规则、关键词和机器学习,其中机器学习(如朴素贝叶斯、SVM、深度学习)是主流。在Python中,可使用scikit-learn进行文本分类,例如通过TF-IDF和朴素贝叶斯对新闻数据集进行处理和预测。随着技术发展,未来将深入探索深度学习和多模态数据在文本分类中的应用。
31 2
|
16天前
|
机器学习/深度学习 数据采集 算法
利用机器学习进行股市预测:方法与挑战
【6月更文挑战第8天】本文深入探讨了机器学习在股市预测中的应用,包括常用的预测模型、数据处理方法以及面临的主要挑战。通过分析历史数据和市场趋势,机器学习技术能够提供有价值的洞察,帮助投资者做出更明智的决策。然而,股市的复杂性和不可预测性给机器学习的应用带来了诸多挑战。尽管如此,随着技术的进步和数据的丰富,机器学习在股市预测中的作用将越来越重要。
14 2

热门文章

最新文章