备案控制台

开发者社区云计算文章正文

交叉熵初识-cross entropy

2022-05-17 152

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 交叉熵初识-cross entropy

定义

在信息论中，交叉熵是表示两个概率分布p,q，其中p表示真实分布，q表示非真实分布，在相同的一组事件中，其中，用非真实分布q来表示某个事件发生所需要的平均比特数。

举例

假设现在有一个样本集中两个概率分布p,q，其中p为真实分布，q为非真实分布。假如，按照真实分布p来衡量识别一个样本所需要的编码长度的期望为：

但是，如果采用错误的分布q来表示来自真实分布p的平均编码长度，则应该是：

此时就将H(p,q)称之为交叉熵。交叉熵的计算方式如下：

以上内容来自交叉熵-百度百科

到这里自己有两个地方不明白：

什么事真事分布与非真实分布？
什么编码长度？
要搞懂这些，还需要看一些信息论中的知识，于是乎找到这篇文章：
信息论中的一些基本的知识
静下心看吧：看完之后自己浮躁的心平静下来了

致Great_VIP

目录

相关文章

使者大牙

|

7月前

|

机器学习/深度学习

为什么在二分类问题中使用交叉熵函数作为损失函数

为什么在二分类问题中使用交叉熵函数作为损失函数

使者大牙

265 2 2

revolution2u

|

Python 机器学习/深度学习

Cross Entropy Loss 交叉熵损失函数公式推导

表达式输出标签表示为{0,1}时，损失函数表达式为： $L = -[y log \hat{y} + (1-y)log(1- \hat{y})]$ 二分类二分类问题，假设 y∈{0,1} 正例：$P(y = 1| x) = \hat{y}$ 反例：$P(y=0|x) = 1-\hat{y}$ 取似然函数似然函数就是所有样本在参数θ下发生概率最大的那种情况，由于样本独立同分布，因此概率最大的情况就是每个样本发生概率的连乘。

revolution2u

15934 0 3

人物我非-32022

|

2月前

|

机器学习/深度学习自然语言处理

交叉熵损失

【10月更文挑战第2天】

人物我非-32022

109 0 0

Deephub

|

4月前

|

机器学习/深度学习算法 Serverless

三元组损失Triplet loss 详解

在这篇文章中,我们将以简单的技术术语解析三元组损失及其变体批量三元组损失,并提供一个相关的例子来帮助你理解这些概念。

Deephub

91 2 2

UE5技术哥

|

机器学习/深度学习

信息熵、KL散度、交叉熵、softmax函数学习小记

信息熵、KL散度、交叉熵、softmax函数学习小记

UE5技术哥

104 0 0

算精通

|

机器学习/深度学习算法 PyTorch

Softmax回归（Softmax Regression）

Softmax回归（Softmax Regression），也称为多类别逻辑回归或多项式回归，是一种用于解决多类别分类问题的统计学习方法。它是逻辑回归在多类别情况下的扩展。

算精通

271 3 3

LeoATLiang

|

机器学习/深度学习数据挖掘 PyTorch

Softmax Classifier 多分类问题

Softmax Classifier 多分类问题

LeoATLiang

105 0 0

宋wz

|

机器学习/深度学习 Python

深度学习基础(一）:sigmoid/softmax/cross Entropy

深度学习基础(一）:sigmoid/softmax/cross Entropy

宋wz

199 0 0

张继群

|

机器学习/深度学习

损失函数：均方误和交叉熵，激活函数的作用

损失函数（loss function）或代价函数（cost function）是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。

张继群

195 1 1

损失函数：均方误和交叉熵，激活函数的作用

yinyipeng

|

机器学习/深度学习

交叉熵以及相对熵的理解

笔记

yinyipeng

181 0 0

热门文章

最新文章

Hadoop迁移MaxCompute神器之DataX-On-Hadoop使用指南

Nginx的启动、停止与重启

Hive之数据倾斜的原因和解决方法

开发人员各级岗位胜任力模型

Node.js 中流操作实践

传奇龙版地图查看器

调整DC的网络对网络是否会有影响?

How to maintain Oracle10g Recyclebin?

你知道自己感染了恶意软件吗？

Groovy 快速入门

Python学习的自我理解和想法（9）

Kimi 上线视觉思考模型，K1 系列强化学习模型正式开放，无需借助外部 OCR 处理图像与文本进行思考并回答

CosyVoice 2.0：阿里开源升级版语音生成大模型，支持多语言和跨语言语音合成，提升发音和音色等的准确性

Megrez-3B-Omni：无问芯穹开源最强端侧全模态模型，支持理解图像、音频和文本三种模态数据

FreeScale：无需微调即可提升模型的图像生成能力，生成 8K 分辨率的高质量图像

Freestyler：微软联合西工大和香港大学推出说唱音乐生成模型，支持控制生成的音色、风格和节奏等

《C 语言与统计假设检验：洞察人工智能模型性能差异》

《C 语言赋能：物联网环境下人工智能应用的能耗优化之道》

《C 语言助力神经网络剪枝：优化模型的卓越之道》

《C 语言复数运算：赋能人工智能信号处理新境界》

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

fs.oss.accessKeyId和fs.oss.accessKeySecret。