开发者社区开发与运维文章正文

决策树中的香农熵(Shannon Entropy)

2023-01-11 345

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 决策树中的香农熵(Shannon Entropy)

香农熵又称信息熵，反映了一条信息的信息量大小和它的不确定性之间的关系，是信息量的度量，单位为 bit。

对于某件事情

不确定性越大，熵越大，确定该事所需的信息量也越大；

不确定性越小，熵越小，确定该事所需的信息量也越小。

假设有一事件XX，XX事件有ii种可能性，每一种可能性发生的概率记为P(Xi)P(Xi)，则香农熵的计算公式为：

计算给定数据集的香农熵(python模块)：

def calsShannonEnt(dataSet):
    numEntries = len(dataSet)
    labelCounts = {}
    for dataVec in dataSet:
        label = dataVec[-1]
        if label not in labelCounts.keys():
            labelCounts[label] = 0
        labelCounts[label] += 1
    shannonEnt = 0.0
    for key in labelCounts.keys():
        prob = float(labelCounts[key]) / numEntries
        shannonEnt -= prob * math.log(prob, 2)
    return shannonEnt
if __name__ == "__main__":
    print("Code Run As A Program")

文章标签：

Python

白水你要努力啊

【方向】

机器学习/深度学习数据可视化 Python

逻辑回归那些事—使用牛顿法解决实际问题

逻辑回归是机器学习中的重要章节，本文将带你从公式推导到算法实现详细讲述这部分内容，想学习这个高大上的技能么，快来看吧！！！

【方向】

5486 0 1

revolution2u

Python 机器学习/深度学习

Cross Entropy Loss 交叉熵损失函数公式推导

表达式输出标签表示为{0,1}时，损失函数表达式为： $L = -[y log \hat{y} + (1-y)log(1- \hat{y})]$ 二分类二分类问题，假设 y∈{0,1} 正例：$P(y = 1| x) = \hat{y}$ 反例：$P(y=0|x) = 1-\hat{y}$ 取似然函数似然函数就是所有样本在参数θ下发生概率最大的那种情况，由于样本独立同分布，因此概率最大的情况就是每个样本发生概率的连乘。

revolution2u

15891 0 3

ma_no_lo

6月前

机器学习/深度学习算法调度

多元线性回归梯度下降法

梯度下降法是一种通用的优化算法，尤其适用于机器学习中找到最优解。与解析解法不同，它不局限于特定情况，能在数据规模较大时依然有效。该方法通过迭代逐步接近最优解，每次迭代利用损失函数的梯度信息调整参数。学习率是控制参数更新幅度的关键因素，太大会导致发散，太小则收敛慢。全量梯度下降每次使用所有样本更新，收敛稳定但速度慢；随机梯度下降每次仅用一个样本，速度快但可能产生较大波动；小批量梯度下降取两者之间，以一定的样本批量进行更新，兼顾速度和稳定性。

ma_no_lo

76 1 1

UE5技术哥

机器学习/深度学习

信息熵、KL散度、交叉熵、softmax函数学习小记

UE5技术哥

97 0 0

虚心求知的熊

机器学习/深度学习

Lesson 4.2 逻辑回归参数估计：极大似然估计、相对熵与交叉熵损失函数-2

虚心求知的熊

178 0 0

虚心求知的熊

机器学习/深度学习算法

Lesson 4.2 逻辑回归参数估计：极大似然估计、相对熵与交叉熵损失函数-1

虚心求知的熊

315 0 0

玩机器学习的章北海-13621

数据可视化算法

13张动图快速理解马尔科夫链、PCA、贝叶斯！

本文用可视化的方式来解释抽象的理论概念，使这些抽象概念变得生动而立体！

玩机器学习的章北海-13621

128 0 0

LiBiGo

机器学习/深度学习人工智能 JavaScript

【Pytorch神经网络理论篇】 21 信息熵与互信息：联合熵+条件熵+交叉熵+相对熵/KL散度/信息散度+JS散度

对抗神经网络（如DIM模型）及图神经网络（如DGI模型）中，使用互信息来作为无监督方式提取特征的方法。

LiBiGo

897 0 0

Deephub

机器学习/深度学习数据挖掘

KL散度和交叉熵的对比介绍

KL散度（Kullback-Leibler Divergence）和交叉熵（Cross Entropy）是在机器学习中广泛使用的概念。这两者都用于比较两个概率分布之间的相似性，但在一些方面，它们也有所不同。本文将对KL散度和交叉熵的详细解释和比较。

Deephub

753 0 0

白水你要努力啊

Python

决策树中熵、条件熵、信息增益及信息增益比的python实现

白水你要努力啊

250 0 0

决策树中的香农熵(Shannon Entropy)

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

决策树中的香农熵(Shannon Entropy)

热门文章

最新文章

相关课程

相关电子书