回归模型评估指标

本文涉及的产品
MSE Nacos/ZooKeeper 企业版试用,1600元额度,限量50份
任务调度 XXL-JOB 版免费试用,400 元额度,开发版规格
注册配置 MSE Nacos/ZooKeeper,182元/月
简介: SSE(和方差、误差平方和):The sum of squares dueto errorMSE(均方差、方差):Meansquared errorRMSE(均方根、标准差):Root mean squared errorR-square(确定系数):Coefficientof determ...
SSE(和方差、误差平方和):The sum of squares dueto error
MSE(均方差、方差):Meansquared error
RMSE(均方根、标准差):Root mean squared error
R-square(确定系数):Coefficientof determination
Adjusted R-square:Degree-of-freedomadjusted coefficient of determination

下面我对以上几个名词进行详细的解释下,相信能给大家带来一定的帮助!!

一、SSE(和方差)

该统计参数计算的是拟合数据和原始数据对应点的误差的平方和,计算公式如下
image

SSE越接近于0,说明模型选择和拟合更好,数据预测也越成功。接下来的MSE和RMSE因为和SSE是同出一宗,所以效果一样

二、MSE(均方差)

该统计参数是预测数据和原始数据对应点误差的平方和的均值,也就是SSE/n,和SSE没有太大的区别,计算公式如下
image

三、RMSE(均方根)

该统计参数,也叫回归系统的拟合标准差,是MSE的平方根,就算公式如下
image

在这之前,我们所有的误差参数都是基于预测值(y_hat)和原始值(y)之间的误差(即点对点)。从下面开始是所有的误差都是相对原始数据平均值(y_ba)而展开的(即点对全)!!!

RMSE和MAE的比较
量纲一样:都是原始数据中y对应的量纲
RMSE > MAE:
这是一个数学规律,一组正数的平均数的平方,小于每个数的平方和的平均数;

四、R-square(确定系数)

在讲确定系数之前,我们需要介绍另外两个参数SSR和SST,因为确定系数就是由它们两个决定的
(1)SSR:Sumof squares of the regression,即预测数据与原始数据均值之差的平方和,公式如下
image

(2)SST:Totalsum of squares,即原始数据和均值之差的平方和,公式如下
image

SST=SSE+SSR,

  • 最好的衡量线性回归法的指标:R Squared
    准确度:[0, 1],即使分类的问题不同,也可以比较模型应用在不同问题上所体现的优劣;

RMSE和MAE有局限性:同一个算法模型,解决不同的问题,不能体现此模型针对不同问题所表现的优劣。因为不同实际应用中,数据的量纲不同,无法直接比较预测值,因此无法判断模型更适合预测哪个问题。
方案:将预测结果转换为准确度,结果都在[0, 1]之间,针对不同问题的预测准确度,可以比较并来判断此模型更适合预测哪个问题;

1.计算方法

image

image

2.对公式的理解

公式image
样式与MSE类似,可以理解为一个预测模型,只是该模型与x无关,在机器学习领域称这种模型为基准模型(Baseline Model),适用于所有的线型回归算法;
基准模型问题:因为其没有考虑x的取值,只是很生硬的以为所有的预测样本,其预测结果都是样本均值
A)因此对公式可以这样理解:
分子是我们的模型预测产生的错误,分母是使用y等于y的均值这个模型所产生的错误
自己的模型预测产生的错误 / 基础模型预测生产的错误,表示自己的模型没有拟合住的数据,因此R2可以理解为,自己的模型拟合住的数据
B)公式推理结论:
R2 <= 1
R2越大越好,当自己的预测模型不犯任何错误时:R2 = 1
当我们的模型等于基准模型时:R2 = 0
如果R2 < 0,说明学习到的模型还不如基准模型。 # 注:很可能数据不存在任何线性关系

3. 公式变形

image

  • R2背后具有其它统计意思
目录
相关文章
|
SQL 开发框架 .NET
分享53个ASP江湖论坛源码,总有一款适合您
分享53个ASP江湖论坛源码,总有一款适合您
|
Java Linux iOS开发
又一款 IDEA 全家桶 神器 ja-netfilter-all 插件
又一款 IDEA 全家桶 神器 ja-netfilter-all 插件
8088 0
又一款 IDEA 全家桶 神器 ja-netfilter-all 插件
|
1月前
|
机器学习/深度学习 人工智能 边缘计算
大模型在医疗领域的应用
🌟蒋星熠Jaxonic,AI开发者,深耕医疗大模型领域。见证代码如何重塑医疗:从影像分析到智能诊断,从药物研发到临床决策。分享技术实践与行业洞察,探索AI赋能健康的时代变革。
大模型在医疗领域的应用
|
数据可视化 数据挖掘 Python
数据分析案例-往届世界杯数据可视化
数据分析案例-往届世界杯数据可视化
879 0
数据分析案例-往届世界杯数据可视化
|
机器学习/深度学习 算法 数据处理
基于深度学习之毛发检测
基于深度学习的毛发检测是一项计算机视觉任务,旨在从图像或视频中检测和分割毛发区域。这项技术在医学图像分析、美容行业、虚拟试衣和增强现实等领域有着广泛的应用。
375 4
|
Android开发
【通讯录教程】苹果安卓鸿蒙系统通用,如何大批量导入手机号码到手机的通讯录,下面教你方法,只需1分钟搞定几万个号码的导入手机电话本
该文介绍了一种快速批量导入手机通讯录的方法,适用于处理大量手机号的需求,如微商管理、客户资料整理等。在QQ同步助手开始收费后,提供了免费的替代方案。步骤包括:下载批量导入软件(链接提供腾讯云盘和百度网盘地址),清空通讯录(非必需),制作符合格式的通讯录文件,并按操作系统(苹果、安卓或鸿蒙)进行导入。整个过程只需1分钟,简便快捷。
2233 2
|
Java API C++
【C++ 与Qt 线程】C++ std::thread 与Qt qthread多线程混合编程
【C++ 与Qt 线程】C++ std::thread 与Qt qthread多线程混合编程
978 1
|
存储 XML 人工智能
在线转换多种矢量和文档格式 - 免费
本文介绍了款强大的在线云库工具,支持多种矢量图形、设计文件、办公文档和字体格式的转换,如AI、CDR、SVG等。该工具具备高效转换、简便操作、高质量输出、跨平台兼容和批量处理等技术优势,适用于设计、工程、办公和网页设计等领域,提升工作效率。无论是在跨平台协作还是处理大量文件时,都是理想的选择。
480 0
在线转换多种矢量和文档格式 - 免费
|
Ubuntu Linux 计算机视觉
Linux安装和使用OpenCV
Linux安装和使用OpenCV
|
机器学习/深度学习 自然语言处理 安全
中文竞技场(MS)大模型评测
分别从写作创作、代码相关、知识常识、中文游戏、人类价值观、NLP专业领域6大领域测评不同模型的效果。
97333 2
中文竞技场(MS)大模型评测