选择正确的错误度量标准:MAPE与sMAPE的优缺点

简介: 选择正确的错误度量标准:MAPE与sMAPE的优缺点

MSE,RMSE,MAE,MAPE,sMAPE…等等有大量不同的错误度量标准,每个错误度量标准都有其优点和缺点,并且涉及的案例比以前更多。那么,如何决定要为我们的项目使用哪种指标呢?

我相信回答这个问题的关键是了解这些最流行的度量标准的优势和局限性。这样,我们就可以选择最适合手头任务的度量标准。这就是为什么在本文中我将介绍我最近使用的两个度量标准。

640.jpg

MAPE 平均绝对百分比误差(Mean Absolute Percentage Error)

平均绝对百分比误差是用于评估预测性能的最受欢迎的指标之一。由以下公式给出。

640.png

其中A_t代表实际值,而F_t是预测值。在这种情况下,如果我们正在做一般回归问题(预测一个人的体重或房屋价格),我们可以将t解释为观察值,或者将其解释为时间序列分析中的时间指数。

该公式通常包括将值乘以100%,以百分比形式表示数字。

优点

  • 以百分比表示,与比例无关,可用于比较不同比例的预测。我们应该记住,虽然MAPE的值可能超过100%。
  • 易于向利益相关者解释。

缺点

  • 当实际值为零时,MAPE会采用未定义的值,例如在需求预测中可能会发生这种情况。此外,当实际值非常接近零时,它将采用极值。
  • MAPE是不对称的,它对负误差(当预测值高于实际值时)要比对正误差施加更大的罚款。解释如下:对于过低的预测,百分比误差不能超过100%。虽然没有太高的预测上限。因此,MAPE将偏向于预测不足而不是过度预测的模型。
  • MAPE假定变量的度量单位具有有意义的零值。因此,尽管预测需求并使用MAPE是有意义的,但当预测温度以摄氏度(不仅是那个)表示时,却没有意义,因为温度具有任意零点。
  • MAPE并非到处都是可微的,在将其用作优化标准时可能会导致问题。

sMAPE 对称平均绝对百分比误差(symmetric Mean Absolute Percentage Error )

在讨论了MAPE之后,我们还将介绍它的建议替代方案之一—对称MAPE。本来可以克服上述不对称性,即预测的无限性高于实际情况。

640.png

那里有几种不同版本的sMAPE。另一种流行且普遍接受的方法是在分母的中加上绝对值,以说明当实际值和预测值均等于0时,sMAPE不确定。

优点

  • 以百分比表示。
  • 修复了原始MAPE的缺点-它同时具有下限(0%)和上限(200%)。

缺点

  • 当真实值和预测值都非常接近零时不稳定。发生这种情况时,我们将处理非常接近零的数字除法。
  • sMAPE可以取负值,因此对“绝对百分比误差”的解释可能会产生误导。
  • 0%到200%的范围解释起来不那么直观,因此通常会忽略sMAPE公式的分母中的2除法。
  • 每当实际值或预测值为0时,sMAPE都会自动达到上边界值。
  • 关于有意义的零值,与MAPE相同的假设。
  • sMAPE在修正无边的不对称性的同时,引入了另一种由公式的分母引起的微妙的不对称性。想象两个案例。在第一个中,我们有A = 100和F =120。sMAPE为18.2%。现在是一个非常相似的情况,其中A = 100,F =80。在这里,我们得出的sMAPE为22.2%。

结论

在本文中,我描述了对回归问题进行性能评估的两种流行方法。虽然它可以解决MAPE的一些缺点,但仍然存在一些问题,并且还会创建一些新问题。您可以调查的其他一些指标是:

平均绝对比例误差(MASE)

平均方向精度(MDA)

准确率的对数(预测值与实际值的比率)


目录
相关文章
|
机器学习/深度学习 编解码 PyTorch
Pytorch实现手写数字识别 | MNIST数据集(CNN卷积神经网络)
Pytorch实现手写数字识别 | MNIST数据集(CNN卷积神经网络)
|
5月前
|
人工智能
复制即所得:PasteMD让Markdown粘贴Office不再有格式烦恼
PasteMD是一款高效实用的开源工具,可将剪贴板中的Markdown或网页内容一键转换为Word/WPS/Excel兼容格式,完美保留公式、表格与样式。支持AI生成内容智能粘贴,解决格式错乱难题,提升文档编辑效率,是学生与职场人士的理想助手。
2176 2
复制即所得:PasteMD让Markdown粘贴Office不再有格式烦恼
|
3月前
|
人工智能 安全 Linux
OpenClaw部署安全使用指南:7大核心Skills精选、云端/本地部署与阿里云百炼API配置指南
2026年,OpenClaw作为本地化部署的个人AI Agent框架持续火爆,其能力扩展的核心在于Skills生态——官方技能市场ClawHub已收录13000+款Skills,覆盖信息获取、工作流管理、开发辅助等多元场景。但繁荣背后暗藏风险,ClawHavoc事件曾曝光1184个恶意Skills,36%的Skills存在prompt注入漏洞,随意安装可能导致数据泄露。
1406 5
|
机器学习/深度学习 开发者 Python
Python中进行特征重要性分析的9个常用方法
在Python机器学习中,特征重要性分析是理解模型预测关键因素的重要步骤。本文介绍了九种常用方法:排列重要性、内置特征重要性(如`coef_`)、逐项删除法、相关性分析、递归特征消除(RFE)、LASSO回归、SHAP值、部分依赖图和互信息。这些方法适用于不同类型模型和场景,帮助识别关键特征,指导特征选择与模型解释。通过综合应用这些技术,可以提高模型的透明度和预测性能。
1989 0
|
SQL 分布式计算 大数据
湖仓融合:MaxComputee与Hologres基于OpenLake的湖上解决方案
本次主题探讨湖仓融合:MaxCompute与Hologres基于OpenLake的湖上解决方案。首先从数据湖和数据仓库的历史及业界解决方案出发,分析湖仓融合的两种思路;接着针对国内问题,介绍阿里云如何通过MaxCompute和Hologres解决湖仓融合中的挑战,特别是在非结构化数据处理方面的能力。最后,重点讲解Object Table为湖仓增添了SQL生态的非结构化数据处理能力,提升数据处理效率和安全性,使用户能够在云端灵活处理各类数据。
|
供应链 算法 定位技术
运筹优化技术在供应链领域应用介绍
运筹优化技术在供应链领域应用介绍
1777 0
|
机器学习/深度学习 人工智能 算法
【机器学习】平均绝对误差 (MAE) 与均方误差 (MSE) 有什么区别?
【5月更文挑战第17天】【机器学习】平均绝对误差 (MAE) 与均方误差 (MSE) 有什么区别?
|
测试技术
性能专题:一文搞懂性能测试常见指标
1. 前言 上周,对性能测试系列专题,在公号内发表了第一篇介绍:【性能系列连载一】开篇:性能测试不可不知的“干货”,但反响貌似并不太好,但既然此前已答应了部分读者要连载分享性能这块的知识,含着泪也得继续写。
4333 0
|
数据采集 数据可视化 数据挖掘
使用Sentieon加速甲基化WGBS数据分析
使用Sentieon加速甲基化WGBS数据分析
593 0
使用Sentieon加速甲基化WGBS数据分析
|
Rust 运维 安全
Kata3.0.0 x LifseaOS x 龙蜥内核三管齐下!带你体验最新的安全容器之旅
袋鼠RunD正式成为安全容器上游社区最新3.0.0标准,龙蜥也已推出最新体验包,带给大家更完整的安全容器体验。
Kata3.0.0 x LifseaOS x 龙蜥内核三管齐下!带你体验最新的安全容器之旅

热门文章

最新文章