神经网络中使用的代价函数被称作损失函数(Loss Function)。
损失函数衡量了预测与真实样本标签的距离。
Loss的值都会设置为和吻合程度负相关。如果算法公式是正相关,定义损失函数时候加负号,调整为负相关。
通常,回归问题的损失函数为均方误差损失函数,而分类问题会选择交叉熵损失函数。
神经网络训练的过程是通过最小化在训练集上的损失函数进行的。
均方误差损失函数(MSE)通常被用于回归问题,而不适合用于分类问题,有时也被称为L_2损失函数。
交叉熵损失函数(Cross Entropy)通常被用于分类问题,相比于MSE,交叉熵损失在分类预测结果和真实结果相差很大时,会有更大的梯度,因此,更适合神经网络训练。