机器学习-西瓜书、南瓜书第四章

简介: 基于树结构来进行决策,体现人类在面临决策问题时一种很自然的处理机制

1.决策树基本流程


概念:基于树结构来进行决策,体现人类在面临决策问题时一种很自然的处理机制

具备条件:

每个非叶节点表示一个特征属性测试

每个分支代表这个特征属性在某个值域上的输出

每个叶子节点存放一个类别

每个节点包含的样本集合通过属性测试被划分到子节点中,根节点包含样本全集

基本算法:

输入: 训练集D=\{(x_1,y_1),(x_2,y_2),\cdot, (x_m,y_m)\}D={(x1,y1),(x2,y2),⋅,(xm,ym)};

  属性集A={a_1,a_2,\cdot,a_d}A=a1,a2,⋅,ad

过程: 函数TreeGenerate(DD,AA)

(1) 生成结点node

(2) if DD中样本全属于同一类别CC then

(3)  将node标记为CC类叶节点; return

(4) end if

(5) if A=\emptysetA=∅ OR DD中样本在AA上取值相同 then

(6)  将node标记为叶结点,其类别标记为DD中样本数最多的类;return

(7) end if

(8) 从AA中选择最优化分属性a_*a∗;

(9) for a_*a∗的每一个值a_*^va∗v do

(10)  为node生成一个分支;令D_vDv表示DD中在a_*a∗上取值为a_*^va∗v的样本子集;

(11)   if D_vDv为空 then

(12)    将分支结点标记为叶结点,其类别标记为DD中样本最多的类; return

(13)  else

(14)    以TreeGenerate(D_vDv, A \backslash \{ a_* \}A\{a∗})为分支结点

(15)  end if

(16) end for

输出: 以node为根结点的一棵决策树

决策树构造以下为参考链接导图:https://zhuanlan.zhihu.com/p/106594756

当前结点包含的样本全部属于同一类,直接将该结点标记为叶结点,其类别设置该类

当属性集为空,或所有样本在所有属性上取值相同,无法进行划分,将该结点标记为叶结点,其类别设置为其父结点所含样本最多的类别

当前结点包含的样本集合为空,不能划分,将该结点标记为叶结点,其类别设置为其父结点所含样本最多的类别

04cf8e733378d2afc72fa9ec569326a9.png

2e7b0e146e1299f97a5aa2b724e0083b.png

d1be6b34b46fc8db40655c5d6c66e1aa.png

目录
相关文章
|
机器学习/深度学习 算法
经典机器学习系列(六)【集成学习】之周志华西瓜书-AdaBoost算法证明解析
经典机器学习系列(六)【集成学习】之周志华西瓜书-AdaBoost算法证明解析
167 0
|
7月前
|
机器学习/深度学习 存储 算法
机器学习(西瓜书)简答题总结
机器学习(西瓜书)简答题总结
60 0
|
机器学习/深度学习 算法 数据挖掘
周志华《机器学习》西瓜书精炼版笔记来了!16 章完整版
周志华《机器学习》西瓜书精炼版笔记来了!16 章完整版
1929 0
周志华《机器学习》西瓜书精炼版笔记来了!16 章完整版
|
机器学习/深度学习 算法
机器学习-西瓜书、南瓜书第六章
支持向量机(Support Vector Machine),简称SVM,是一种经典的二分类模型,属于监督学习算法。
124 0
机器学习-西瓜书、南瓜书第六章
|
机器学习/深度学习
机器学习-西瓜书、南瓜书第五章
神经网络起源于生物神经元的生物原理,生物神经元通常包括细胞体、树突和轴突等部分。其中,树突适用于接受输入信息,突触对输入信息进行处理,达到一定条件后由轴突产生输出,此时神经元表现为激活兴奋的状态。
117 0
机器学习-西瓜书、南瓜书第五章
|
机器学习/深度学习 数据采集 算法
机器学习-西瓜书、南瓜书第三章
回归任务最常用的性能度量是均方误差,因为均方误差有比较好的几何意义,对应了最常用的**“欧氏距离”,最小二乘法就是基于均方误差进行模型求解的。 求解均方误差最小化的过程称为参数估计
120 0
机器学习-西瓜书、南瓜书第三章
|
机器学习/深度学习 算法 数据挖掘
机器学习-西瓜书第一、二章
数据集:所有数据的集合 训练集:训练样本的集合 属性(特征):某事物或对象在某方面表现的性质 属性值:属性的取值 属性空间/样本空间/输入空间:属性张成的空间 泛化能力:学得模型适用于新样本的能力(泛化能力强更好地适用于样本空间)
179 0
机器学习-西瓜书第一、二章
|
机器学习/深度学习 算法
机器学习【西瓜书/南瓜书】--- 第2章模型评估与选择(下)(学习笔记+公式推导)
本博客为博主在学习 机器学习【西瓜书 / 南瓜书】过程中的学习笔记,每一章都是对《西瓜书》、《南瓜书》内容的总结和提炼笔记,博客可以作为各位读者的辅助思考,也可以做为读者快读书籍的博文,本博客对西瓜书所涉及公式进行详细的推理以及讲解,本人认为,不推导公式所学得的知识是没有深度的,是很容易忘记的,有些公式推导起来并不复杂,只是被看似复杂的数学表达式所“吓唬”,希望大家拿上纸笔,跟着博主一起学习,一起推导。
231 0
机器学习【西瓜书/南瓜书】--- 第2章模型评估与选择(下)(学习笔记+公式推导)
|
机器学习/深度学习 算法 数据挖掘
机器学习【西瓜书/南瓜书】--- 第1章绪论(学习笔记+公式推导)
本博客为博主在学习 机器学习【西瓜书 / 南瓜书】过程中的学习笔记,每一章都是对《西瓜书》、《南瓜书》内容的总结和提炼笔记,博客可以作为各位读者的辅助思考,也可以做为读者快读书籍的博文,本博客对西瓜书所涉及公式进行详细的推理以及讲解,本人认为,不推导公式所学得的知识是没有深度的,是很容易忘记的,有些公式推导起来并不复杂,只是被看似复杂的数学表达式所“吓唬”,希望大家拿上纸笔,跟着博主一起学习,一起推导。
244 0
机器学习【西瓜书/南瓜书】--- 第1章绪论(学习笔记+公式推导)
|
7月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
248 14