瞎聊机器学习——准确率、精确率、召回率、F1 score

简介: 瞎聊机器学习——准确率、精确率、召回率、F1 score

针对分类、回归、排序等问题的模型评估,不同的问题有不同的评估方法,今天重点来说一下关于分类问题的准确率(Accuracy)、精确率(precision)、召回率(Recall)、F1 score。


准确率(Accuracy)

准确率指的是分类正确的样本占总样本个数的比例

即:image.png

其中image.png就是被分类正确的样本个数,image.png是总样本的个数。


精确率(precision)

精确率是指分类正确的正样本个数占分类器判定为正样本的个数的比例。

即:image.png

其中image.png表示分类正确的正样本的数量,image.png表示所有被分为正样本的数量。


召回率(Recall)

召回率是指分类正确的正样本占真实正样本的比例。

即:image.png

其中image.png表示分类正确的正样本的数量,image.png表示真实正样本的数量。


F1 score

F1 score可以认为是精确率和召回率的调和平均值。

image.png


举例说明一下这几个值的计算方法

假设某个班级有男生80人,女生20人,共100人,目的是找出所有的女生。

第一次:挑出50人,其中女生有15人(分类正确),有35个男生(分类错误)。

第二次:挑出50人,其中女生有20人(分类正确),有30个男生(分类错误)。


计算一下相应的值

第一次:

Accuracy = (15+(80-35))/100 = 60%

Precision = 15/50 = 30%

Recall = 15/20 = 75%

F1 = 2*0.3*0.75/0.3+0.75=42.9%

第二次:

Accuracy = (20+(80-30))/100 = 70%

Precision = 20/50 = 40%

Recall = 20/20 = 100%

F1 = 2*0.4*1/0.4+1 = 57.1%


根据两次结果我们可以对比出每种分类结果(不同分类器)之间的差距,在评估时我们可能会希望Precision越高越好,同样也希望Recall越高越好,但是我们考虑只抽取一个人且是女生的情况,此时的precision很高,但Recall却很低,我们并不能认为该分类方法是很好的,想要去衡量这个问题,我们可以绘制P-R曲线(横坐标为召回率,纵坐标为精确率)来对比不同分类器的表现好坏。

相关文章
|
4天前
|
机器学习/深度学习 Java
机器学习中的召回率与准确率详解
机器学习中的召回率与准确率详解
|
9月前
|
机器学习/深度学习 人工智能 监控
如何利用机器学习提高人脸识别准确率
如何利用机器学习提高人脸识别准确率
146 1
|
机器学习/深度学习
|
机器学习/深度学习
【技术分享】机器学习分类性能指标:准确率Accuracy/精确率Precision/召回率Recall/F1值
【技术分享】机器学习分类性能指标:准确率Accuracy/精确率Precision/召回率Recall/F1值
271 0
【技术分享】机器学习分类性能指标:准确率Accuracy/精确率Precision/召回率Recall/F1值
|
机器学习/深度学习
机器学习:分类模型的评估精确率Presicion和召回率Recall
机器学习:分类模型的评估精确率Presicion和召回率Recall
167 0
机器学习:分类模型的评估精确率Presicion和召回率Recall
|
1天前
|
机器学习/深度学习 数据采集 算法
【机器学习】CART决策树算法的核心思想及其大数据时代银行贷款参考案例——机器认知外界的重要算法
【机器学习】CART决策树算法的核心思想及其大数据时代银行贷款参考案例——机器认知外界的重要算法
|
4天前
|
机器学习/深度学习 分布式计算 算法
在机器学习项目中,选择算法涉及问题类型识别(如回归、分类、聚类、强化学习)
【6月更文挑战第28天】在机器学习项目中,选择算法涉及问题类型识别(如回归、分类、聚类、强化学习)、数据规模与特性(大数据可能适合分布式算法或深度学习)、性能需求(准确性、速度、可解释性)、资源限制(计算与内存)、领域知识应用以及实验验证(交叉验证、模型比较)。迭代过程包括数据探索、模型构建、评估和优化,结合业务需求进行决策。
9 0
|
4天前
|
机器学习/深度学习 算法
机器学习中的超参数优化涉及手动尝试、网格搜索、随机搜索、贝叶斯优化、梯度优化、进化算法等策略
【6月更文挑战第28天】**机器学习中的超参数优化涉及手动尝试、网格搜索、随机搜索、贝叶斯优化、梯度优化、进化算法等策略。工具如scikit-optimize、Optuna助力优化,迁移学习和元学习提供起点,集成方法则通过多模型融合提升性能。资源与时间考虑至关重要,交叉验证和提前停止能有效防止过拟合。**
10 0
|
5天前
|
机器学习/深度学习 算法 数据可视化
技术心得记录:机器学习笔记之聚类算法层次聚类HierarchicalClustering
技术心得记录:机器学习笔记之聚类算法层次聚类HierarchicalClustering
|
5天前
|
数据采集 机器学习/深度学习 算法
机器学习方法之决策树算法
决策树算法是一种常用的机器学习方法,可以应用于分类和回归任务。通过递归地将数据集划分为更小的子集,从而形成一棵树状的结构模型。每个内部节点代表一个特征的判断,每个分支代表这个特征的某个取值或范围,每个叶节点则表示预测结果。
22 1