决策树和机器学习算法的贝叶斯解释

简介: 决策树和机器学习算法的贝叶斯解释

我记得我在选修一门课程时,教授花了两节课反复研究决策树的数学原理,然后才宣布:“同学们,决策树算法不使用任何这些。”很显然,这些课程并不是关于基尼系数或熵增益的。教授在讲课时几分钟就避开了他们。这两节课是180分钟的贝叶斯定理和贝塔分布的交锋。那么,为什么我们被鼓励去研究所有这些数学呢?好吧,增长决策树的常用方法是该贝叶斯模型的近似值。但这不是。该模型还包含一个初级集成方法的思想。这样一来,让我们投入一些数学知识,并探讨贝叶斯定理的优越性。(注意:我假设您知道概率概念,例如随机变量,贝叶斯定理和条件概率)

应对挑战

我想你应该熟悉决策树以及它们是如何利用基尼系数或熵损失来工作的。所以,我们将用贝叶斯定理来代替它。考虑一个需要使用决策树来解决的二元分类问题。我们的挑战是通过在决策过程中包括所有树来对新数据实例x进行分类。您将如何进行呢?

如前所述,您必须使用贝叶斯来处理这个问题,它计算x属于特定类Y (y1或y2)的概率。利用这个概率,您可以决定合适的类。注意,从现在开始,我们将把X和Y看作随机变量(RV)。但你只需要这些RV吗?不,估计P(Y|X= X)依赖于另外两个东西。

让我们考虑一下涉及所有可能的决策树的难题。并不是所有的树都足够“绿”来解决这个问题。为什么如此?对于任何问题,通常使用基尼系数或熵增益来挖掘出最能隔离训练数据的树。这表明任何特定的数据集d都有一个唯一的拟合树。因此,如果你认为树和数据集是RVs,那么,对于一个特定的树T= T和训练数据集D= D,你可以找到概率估计,P(T= T |D= D), T如何在D上工作。理想的树将有最大值P(T= T |D= D)。此外,每个树还将对数据实例进行不同的分类。本质上,属于任何类P(Y|X= X, T= T, D= D)的新数据实例的概率在不同的树之间是不同的。现在,你是否意识到为了完成这个奇怪挑战,你需要为每棵树设置两种讨论过的概率?观察下面的方程。你怎么看?

L.H.S是属于y1的x的最终概率估计。这取决于训练数据集,因为对于不同的数据集,树将进行修改。R.H.S建议在决策过程中包括所有树,我们应将x属于树t的y1的概率乘以树是理想候选者的概率,然后将所有乘积求和。换句话说,您做出的最终决定应该是所有树的分类概率的加权总和。因此,如果一棵树很好地分离了训练数据,则P(T = t | D = d)很高,它将在最终决策中有更多发言权。

等式的可能扩展

在最可靠的预测模型中,高级集成方法也可以根据上述公式运行。他们使用来自众多小树的预测的加权总和来对数据实例进行分类。请注意,与我的挑战不同,集成方法不能评估所有可能的树的预测。那会浪费计算能力。通过基尼系数或熵增益之类的过程,它们隐式地逼近P(T | D)并忽略了伪劣树。因此,基尼(Gini)和熵(Entropy)只是计算效率高的方法,可以解决贝叶斯解决方案的其他问题。

但是我们不必一定将方程式限制在树上。您可以使用不同的分类或回归模型(ML算法)来代替几棵树,并计算其概率预言的加权平均值以做出最终决定。在这里,您只需要用另一个随机变量M替换随机变量T,该随机变量M包含各种模型(算法)的数组。

640.jpg

总结

本文是关于贝叶斯定理如何形成集成方法症结的一个极其简短的概述。目的是从贝叶斯的角度理解决策树,并突出显示贝叶斯统计数据在任何ML算法的背景下如何总是隐秘地工作。我故意没有讨论过如何计算所讨论方程式中的每个项。这将花费很长时间,并且还涉及其他一些数学概念,例如Beta分布等。虽然本问主要说的贝叶斯理论但是,决策树是很重要的这个是肯定的。

目录
相关文章
|
11天前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
37 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
16天前
|
算法
树的遍历算法有哪些?
不同的遍历算法适用于不同的应用场景。深度优先搜索常用于搜索、路径查找等问题;广度优先搜索则在图的最短路径、层次相关的问题中较为常用;而二叉搜索树的遍历在数据排序、查找等方面有重要应用。
22 2
|
29天前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于贝叶斯优化CNN-LSTM网络的数据分类识别算法matlab仿真
本项目展示了基于贝叶斯优化(BO)的CNN-LSTM网络在数据分类中的应用。通过MATLAB 2022a实现,优化前后效果对比明显。核心代码附带中文注释和操作视频,涵盖BO、CNN、LSTM理论,特别是BO优化CNN-LSTM网络的batchsize和学习率,显著提升模型性能。
|
1月前
|
机器学习/深度学习 算法 Java
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
|
1月前
|
机器学习/深度学习 算法 决策智能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能
|
1月前
|
机器学习/深度学习 算法 Python
探索机器学习中的决策树算法:从理论到实践
【10月更文挑战第5天】本文旨在通过浅显易懂的语言,带领读者了解并实现一个基础的决策树模型。我们将从决策树的基本概念出发,逐步深入其构建过程,包括特征选择、树的生成与剪枝等关键技术点,并以一个简单的例子演示如何用Python代码实现一个决策树分类器。文章不仅注重理论阐述,更侧重于实际操作,以期帮助初学者快速入门并在真实数据上应用这一算法。
|
20天前
|
机器学习/深度学习 人工智能 算法
探索机器学习中的决策树算法
【10月更文挑战第29天】本文将深入浅出地介绍决策树算法,一种在机器学习中广泛使用的分类和回归方法。我们将从基础概念出发,逐步深入到算法的实际应用,最后通过一个代码示例来直观展示如何利用决策树解决实际问题。无论你是机器学习的初学者还是希望深化理解的开发者,这篇文章都将为你提供有价值的见解和指导。
|
1月前
|
机器学习/深度学习
如何用贝叶斯方法来解决机器学习中的分类问题?
【10月更文挑战第5天】如何用贝叶斯方法来解决机器学习中的分类问题?
|
1月前
|
存储 算法 关系型数据库
数据结构与算法学习二一:多路查找树、二叉树与B树、2-3树、B+树、B*树。(本章为了解基本知识即可,不做代码学习)
这篇文章主要介绍了多路查找树的基本概念,包括二叉树的局限性、多叉树的优化、B树及其变体(如2-3树、B+树、B*树)的特点和应用,旨在帮助读者理解这些数据结构在文件系统和数据库系统中的重要性和效率。
24 0
数据结构与算法学习二一:多路查找树、二叉树与B树、2-3树、B+树、B*树。(本章为了解基本知识即可,不做代码学习)
|
1月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于贝叶斯优化卷积神经网络(Bayes-CNN)的多因子数据分类识别算法matlab仿真
本项目展示了贝叶斯优化在CNN中的应用,包括优化过程、训练与识别效果对比,以及标准CNN的识别结果。使用Matlab2022a开发,提供完整代码及视频教程。贝叶斯优化通过构建代理模型指导超参数优化,显著提升模型性能,适用于复杂数据分类任务。
下一篇
无影云桌面