神经网络的交叉熵损失函数

简介: 常见损失函数0-1损失函数 L(Y,f(X))={1,0Y != f(X)Y = f(X)L(Y,f(X))=\begin{cases}1,& \text{Y != f(X)}\\0& ...

常见损失函数

  • 0-1损失函数
    L(Y,f(X))={1,0Y != f(X)Y = f(X)
  • 平方损失函数
    L(Y,f(X))=(Yf(X))2
  • 绝对损失函数 L(Y,f(X))=|(Yf(X))|
  • 对数损失函数 L(Y,P(Y|X))=logP(Y|X)

常见的损失函数包含以上几个。

平方损失函数

在神经网络中样本的平方损失函数一般会定义为:
Ed=12i(ziyi)2 ,方便求导后约掉系数。

使用误差逆传播训练神经网络时会使用梯度下降法来更新每个神经网络中的权重,
根据链式求导法可以得到权重更新公式,

Edwji=Ednodejnodejwji=Ednodejiwjixjiwji=Ednodejxji

此时对于输出层,权重更新公式为
Edwji=Edyjyjnodejxji

sigmoid激活函数

如果神经元使用sigmoid激活函数,即 y=11+ez
,函数图如下,
这里写图片描述

则梯度下降法更新权重时,会涉及到sigmoid函数的导数,这个导数的形状大致如下:
这里写图片描述
可以看到导数两边的值基本都接近0,也就是说两边的斜率很平缓,两边的点在使用梯度下降时下降很缓慢,可能会影响训练最终效果。

交叉熵损失函数

针对以上不足,有两个方向来避免,一是从激活函数下手,一个是从损失函数下手。这里我们不换激活函数,还是用sigmoid函数,于是引入了交叉熵损失函数。

L=i[zilnyi+(1zi)ln(1yi)]

这时再看权重更新公式,
Lwji=Lnodejnodejwji=Lnodejiwjixjiwji=Lnodejxji

此时对于输出层,权重更新公式为
Lwji=Lyjyjnodejxji=xji(zjyj)

可以看到梯度下降已经不与sigmoid的导数相关了,而是由误差来影响,当误差较大时则下降较快,让梯度下降法更有效率,避免了训练慢的问题。

以下是广告相关阅读

========广告时间========

鄙人的新书《Tomcat内核设计剖析》已经在京东销售了,有需要的朋友可以到 https://item.jd.com/12185360.html 进行预定。感谢各位朋友。

为什么写《Tomcat内核设计剖析》

=========================

相关阅读:
机器学习之神经网络

欢迎关注:

这里写图片描述

目录
相关文章
|
7月前
|
机器学习/深度学习 缓存 算法
【论文速递】CVPR2020 - CRNet:用于小样本分割的交叉参考网络
【论文速递】CVPR2020 - CRNet:用于小样本分割的交叉参考网络
|
7月前
|
机器学习/深度学习 缓存 算法
【论文速递】IJCV2022 - CRCNet:基于交叉参考和区域-全局条件网络的小样本分割
【论文速递】IJCV2022 - CRCNet:基于交叉参考和区域-全局条件网络的小样本分割
|
2月前
|
云安全 安全 网络安全
云计算与网络安全:探索云服务、网络安全和信息安全的交叉点
【10月更文挑战第5天】随着云计算技术的飞速发展,越来越多的企业和个人开始将数据和服务迁移到云端。然而,这种转变也带来了新的安全挑战。本文将深入探讨云计算环境下的网络安全问题,包括云服务的安全性、网络安全的重要性以及如何确保信息安全。我们将通过分析当前的威胁模型、安全策略和最佳实践,为读者提供一个全面的云计算安全框架。
|
1月前
|
存储 安全 网络安全
云计算与网络安全:探索云服务、网络安全和信息安全的交叉点
【10月更文挑战第24天】本文深入探讨了云计算与网络安全之间的复杂关系。随着云计算的普及,网络安全问题日益突出。本文将介绍云服务的基本概念,分析其在网络安全领域的重要性,并讨论如何通过技术和策略保护云计算环境的安全。最后,我们将提供一些代码示例,以帮助读者更好地理解如何实现云计算环境下的网络安全。
32 0
|
3月前
|
机器学习/深度学习
小土堆-pytorch-神经网络-损失函数与反向传播_笔记
在使用损失函数时,关键在于匹配输入和输出形状。例如,在L1Loss中,输入形状中的N代表批量大小。以下是具体示例:对于相同形状的输入和目标张量,L1Loss默认计算差值并求平均;此外,均方误差(MSE)也是常用损失函数。实战中,损失函数用于计算模型输出与真实标签间的差距,并通过反向传播更新模型参数。
|
3月前
|
机器学习/深度学习 自动驾驶 搜索推荐
深度学习之探索神经网络、感知器与损失函数
在当今的数字化时代,深度学习作为一种强大的机器学习技术,正在迅速改变着我们的生活方式。无论是智能推荐系统、自动驾驶车辆还是语音识别应用,深度学习都在背后默默地发挥作用。
59 1
|
5月前
|
存储 人工智能 安全
云计算与网络安全:探索云服务、网络安全和信息安全的交叉点
本文将深入探讨云计算与网络安全之间的紧密联系。我们将分析云服务如何改变传统的网络安全防护模式,以及这些变化如何影响信息安全的未来发展。文章将详细讨论云服务提供的安全优势,同时揭示其潜在的安全风险。我们还将探索网络安全在保护云基础设施中的关键作用,以及信息安全技术如何适应云计算环境的挑战。通过对比分析和案例研究,本文旨在为读者提供一个全面的视角,以理解云计算与网络安全之间复杂而微妙的关系。
72 1
|
6月前
|
机器学习/深度学习 Java Serverless
Java开发者的神经网络进阶指南:深入探讨交叉熵损失函数
今天来讲一下损失函数——交叉熵函数,什么是损失函数呢?大体就是真实与预测之间的差异,这个交叉熵(Cross Entropy)是Shannon信息论中一个重要概念,主要用于度量两个概率分布间的差异性信息。在信息论中,交叉熵是表示两个概率分布 p,q 的差异,其中 p 表示真实分布,q 表示预测分布,那么 H(p,q)就称为交叉熵:
|
7月前
|
机器学习/深度学习 算法 搜索推荐
SPSS大学生网络购物行为研究:因子分析、主成分、聚类、交叉表和卡方检验
SPSS大学生网络购物行为研究:因子分析、主成分、聚类、交叉表和卡方检验
|
7月前
|
存储 安全 网络安全
云计算与网络安全:云服务、网络安全和信息安全的交叉领域
【5月更文挑战第31天】随着云计算技术的飞速发展,其安全性问题也日益凸显。本文将探讨云计算与网络安全的关系,包括云服务的安全性、网络安全的挑战以及信息安全的重要性。我们将深入分析云计算环境下的安全威胁,并提出相应的防护策略。通过本文,读者将更好地理解云计算与网络安全之间的紧密联系,并掌握保护云服务安全的关键技术和方法。

热门文章

最新文章

下一篇
DataWorks