开发者社区开发与运维文章正文

决策树中的香农熵(Shannon Entropy)

2023-01-11 279

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 决策树中的香农熵(Shannon Entropy)

香农熵又称信息熵，反映了一条信息的信息量大小和它的不确定性之间的关系，是信息量的度量，单位为 bit。

对于某件事情

不确定性越大，熵越大，确定该事所需的信息量也越大；

不确定性越小，熵越小，确定该事所需的信息量也越小。

假设有一事件XX，XX事件有ii种可能性，每一种可能性发生的概率记为P(Xi)P(Xi)，则香农熵的计算公式为：

计算给定数据集的香农熵(python模块)：

def calsShannonEnt(dataSet):
    numEntries = len(dataSet)
    labelCounts = {}
    for dataVec in dataSet:
        label = dataVec[-1]
        if label not in labelCounts.keys():
            labelCounts[label] = 0
        labelCounts[label] += 1
    shannonEnt = 0.0
    for key in labelCounts.keys():
        prob = float(labelCounts[key]) / numEntries
        shannonEnt -= prob * math.log(prob, 2)
    return shannonEnt
if __name__ == "__main__":
    print("Code Run As A Program")

文章标签：

Python

白水你要努力啊

使者大牙

1月前

机器学习/深度学习

为什么在二分类问题中使用交叉熵函数作为损失函数

使者大牙

50 2 2

【方向】

机器学习/深度学习数据可视化 Python

逻辑回归那些事—使用牛顿法解决实际问题

逻辑回归是机器学习中的重要章节，本文将带你从公式推导到算法实现详细讲述这部分内容，想学习这个高大上的技能么，快来看吧！！！

【方向】

5432 0 1

revolution2u

Python 机器学习/深度学习

Cross Entropy Loss 交叉熵损失函数公式推导

表达式输出标签表示为{0,1}时，损失函数表达式为： $L = -[y log \hat{y} + (1-y)log(1- \hat{y})]$ 二分类二分类问题，假设 y∈{0,1} 正例：$P(y = 1| x) = \hat{y}$ 反例：$P(y=0|x) = 1-\hat{y}$ 取似然函数似然函数就是所有样本在参数θ下发生概率最大的那种情况，由于样本独立同分布，因此概率最大的情况就是每个样本发生概率的连乘。

revolution2u

15658 0 3

ma_no_lo

20天前

机器学习/深度学习算法调度

多元线性回归梯度下降法

梯度下降法是一种通用的优化算法，尤其适用于机器学习中找到最优解。与解析解法不同，它不局限于特定情况，能在数据规模较大时依然有效。该方法通过迭代逐步接近最优解，每次迭代利用损失函数的梯度信息调整参数。学习率是控制参数更新幅度的关键因素，太大会导致发散，太小则收敛慢。全量梯度下降每次使用所有样本更新，收敛稳定但速度慢；随机梯度下降每次仅用一个样本，速度快但可能产生较大波动；小批量梯度下降取两者之间，以一定的样本批量进行更新，兼顾速度和稳定性。

ma_no_lo

39 1 1

UE5技术哥

9月前

机器学习/深度学习

信息熵、KL散度、交叉熵、softmax函数学习小记

UE5技术哥

60 0 0

算精通

9月前

机器学习/深度学习数据采集

多项式回归

机器学习中的多项式回归是一种用于解决回归问题的非线性模型。与线性回归不同，

算精通

71 2 2

aliyun9861394983-11302

9月前

机器学习/深度学习算法

非线性世界的探索：多项式回归解密

aliyun9861394983-11302

48 0 0

感谢地心引力

曲线拟合-最小二乘法

线性最小二乘法及matlab例程

感谢地心引力

87 0 0

虚心求知的熊

机器学习/深度学习算法

Lesson 4.2 逻辑回归参数估计：极大似然估计、相对熵与交叉熵损失函数-1

虚心求知的熊

180 0 0

虚心求知的熊

机器学习/深度学习

Lesson 4.2 逻辑回归参数估计：极大似然估计、相对熵与交叉熵损失函数-2

虚心求知的熊

138 0 0

决策树中的香农熵(Shannon Entropy)

热门文章

最新文章

相关课程

相关电子书