【技术分享】机器学习分类性能指标:准确率Accuracy/精确率Precision/召回率Recall/F1值

简介: 【技术分享】机器学习分类性能指标:准确率Accuracy/精确率Precision/召回率Recall/F1值

1. 准确率Accuracy

准确率的定义:对于给定的测试数据集,分类器正确分类的样本数与总样本数之比。

举例:有100封邮件,有85封邮件预测正确,那么准确率即为:85/100=85%。

注:85封邮件预测正确,这个“预测正确”有2种情况:

①是垃圾邮件,预测结果也是垃圾邮件——预测正确。

②是正常邮件(不是垃圾邮件),预测结果也是正常邮件——预测正确。


2. 精确率Precision/召回率Recall/F1值

预测问题会有下列4种情况:

TP——将正类预测为正类的数量

FN——将正类预测为负类的数量

FP——将负类预测为正类的数量

TN——将负类预测为负类的数量。


通常,以关注的类作为“正类”,其他类为负类。在垃圾邮件检测中,“垃圾邮件”是正类,则“正常邮件”是负类。则TP/FN/FP/TN的理解如下:


TP——是垃圾邮件(正类),预测结果是垃圾邮件(预测为正类)

FN——是垃圾邮件(正类),预测结果是正常邮件(预测为负类)

FP——是正常邮件(负类),预测结果是垃圾邮件(预测为正类)

TN——是正常邮件(负类),预测结果是正常邮件(预测为负类)


2.1. 精确率(Precision)

精确率(Precision)的定义如下:


image.pngimage.png

image.png



理解:

①TP——是垃圾邮件(正类),预测结果是垃圾邮件(预测为正类)

②FP——是正常邮件(负类),预测结果是垃圾邮件(预测为正类)

③TP+FP——可能是垃圾邮件/也可能是正常邮件,但预测结果都是垃圾邮件。

则精确率(P)的含义就是:你预测结果是垃圾邮件的这些邮件中(TP+FP),有多少个是真正的垃圾邮件(TP)?


2.2. 召回率(Recall)

召回率(Recall)的定义如下:


image.png

image.png


理解:

①TP——是垃圾邮件(正类),预测结果是垃圾邮件(预测为正类)

②FN——是垃圾邮件(正类),预测结果是正常邮件(预测为负类)

③TP+FN——是垃圾邮件,但预测结果可能是垃圾邮件也可能是正常邮件。


则召回率(R)的含义就是:有这么多的垃圾邮件(TP+FN),有多少是你预测对的(TP)?


2.3. F1值(F1 score)

F1值(F1 score)的定义如下:

image.png

F1score的作用是对精确率和召回率进行调和。


目录
相关文章
|
1月前
|
机器学习/深度学习
如何用贝叶斯方法来解决机器学习中的分类问题?
【10月更文挑战第5天】如何用贝叶斯方法来解决机器学习中的分类问题?
|
1月前
|
机器学习/深度学习 存储 自然语言处理
【机器学习】基于逻辑回归的分类预测
【机器学习】基于逻辑回归的分类预测
|
1月前
|
机器学习/深度学习 算法 数据可视化
机器学习的核心功能:分类、回归、聚类与降维
机器学习领域的基本功能类型通常按照学习模式、预测目标和算法适用性来分类。这些类型包括监督学习、无监督学习、半监督学习和强化学习。
30 0
|
1月前
|
机器学习/深度学习 传感器 算法
机器学习入门(一):机器学习分类 | 监督学习 强化学习概念
机器学习入门(一):机器学习分类 | 监督学习 强化学习概念
|
3月前
|
机器学习/深度学习 人工智能 算法
【人工智能】机器学习、分类问题和逻辑回归的基本概念、步骤、特点以及多分类问题的处理方法
机器学习是人工智能的一个核心分支,它专注于开发算法,使计算机系统能够自动地从数据中学习并改进其性能,而无需进行明确的编程。这些算法能够识别数据中的模式,并利用这些模式来做出预测或决策。机器学习的主要应用领域包括自然语言处理、计算机视觉、推荐系统、金融预测、医疗诊断等。
66 1
|
3月前
|
机器学习/深度学习 算法
【机器学习】简单解释贝叶斯公式和朴素贝叶斯分类?(面试回答)
简要解释了贝叶斯公式及其在朴素贝叶斯分类算法中的应用,包括算法的基本原理和步骤。
76 1
|
3月前
|
机器学习/深度学习
如何用贝叶斯方法来解决机器学习中的分类问题?
如何用贝叶斯方法来解决机器学习中的分类问题?
|
3月前
|
机器学习/深度学习 搜索推荐 数据挖掘
【深度解析】超越RMSE和MSE:揭秘更多机器学习模型性能指标,助你成为数据分析高手!
【8月更文挑战第17天】本文探讨机器学习模型评估中的关键性能指标。从均方误差(MSE)和均方根误差(RMSE)入手,这两种指标对较大预测偏差敏感,适用于回归任务。通过示例代码展示如何计算这些指标及其它如平均绝对误差(MAE)和决定系数(R²)。此外,文章还介绍了分类任务中的准确率、精确率、召回率和F1分数,并通过实例说明这些指标的计算方法。最后,强调根据应用场景选择合适的性能指标的重要性。
458 0
|
8天前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
28 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024

热门文章

最新文章