机器学习｜多分类的精确率和召回率-阿里云开发者社区

机器学习｜多分类的精确率和召回率

2023-02-09 1166 发布于北京

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 多分类的精确率和召回率。

我们常用的精确率和召回率通常都用于二分类的问题上，那么在多分类上应该怎样去使用这些评价指标呢？

多分类的精确率和召回率

既然精确率和召回率的概念以及计算公式都指向二分类问题，那么我们不妨将多分类问题转换为二分类问题来做。

先来看一下精确率和召回率的概念：

精确率是指分类正确的正样本个数占分类器判定为正样本的个数的比例。
召回率是指分类正确的正样本占真实正样本的比例。

根据概念我们知道，在转换为二分类的过程中，我们重点在意的就是怎样去做正样本，其实我们可以把每个类别单独视为“正”，所有的其他类型视为“负”。

举个例子：

在进行例子之前，我们先来了解一个概念叫做——混淆矩阵。

对于上面这个表格，我们就可以把它叫做是一个混淆矩阵，在混淆矩阵中，每一行之和表示该类别的真实样本数量，每一列之和表示被预测为该类别的样本数量。

那么对于这个混淆矩阵我们就可以计算它每一个类别的精确率和召回率：

分类1的精确率（此时把分类1当作正样本，其余为负样本）：

分类正确的正样本=43

分类器判定为正样本=50

P=43/50

分类1的召回率：

分类正确的正样本=43

真实正样本=45

R=43/45

分类2的精确率（此时把分类2当作正样本，其余为负样本）：

分类正确的正样本=45

分类器判定为正样本=50

P=45/50

分类2的召回率：

分类正确的正样本=45

真实正样本=51

R=45/51

分类3的精确率（此时把分类3当作正样本，其余为负样本）：

分类正确的正样本=49

分类器判定为正样本=50

P=4950

分类3的召回率：

分类正确的正样本=49

真实正样本=54

R=49/54

得到了每个分类对应的P和R值他们的F1 score就可以用下面的式子算得：

用代码实现一下该计算方式：

M= [
    [14371, 6500, 9, 0, 0, 2, 316],
    [5700, 22205, 454, 20, 0, 11, 23],
    [0, 445, 3115, 71, 0, 11, 0],
    [0, 0, 160, 112, 0, 0, 0],
    [0, 888, 39, 2, 0, 0, 0],
    [0, 486, 1196, 30, 0, 74, 0],
    [1139, 35, 0, 0, 0, 0, 865]
]
n=len(M)
foriinrange(n):
rowsum, colsum=sum(M[i]), sum(M[r][i] forrinrange(n))
try:
print ('precision: %s'% (M[i][i]/float(colsum)), 'recall: %s'% (M[i][i]/float(rowsum)))
exceptZeroDivisionError:
print ('precision: %s'%0, 'recall: %s'%0)

机器学习｜多分类的精确率和召回率

多分类的精确率和召回率

举个例子：

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

机器学习｜多分类的精确率和召回率

多分类的精确率和召回率

举个例子：

热门文章

最新文章

相关课程

相关电子书

相关实验场景