面积曲线AUC(area under curve)

简介: 面积曲线AUC(area under curve)

1 ROC

首先介绍 ROC。ROC 分析是从医疗分析领域引入了一种新的分类模型 performance 评判方法。

ROC的全名叫做Receiver Operating Characteristic,其主要分析工具是一个画在二维平面上的曲线——ROC curve。平面的横坐标是false positive rate(FPR),纵坐标是true positive rate(TPR)。对某个分类器而言,我们可以根据其在测试样本上的表现得到一个TPR和FPR点对。这样,此分类器就可以映射成ROC平面上的一个点。调整这个分类器分类时候使用的阈值,我们就可以得到一个经过(0, 0),(1, 1)的曲线,这就是此分类器的ROC曲线。一般情况下,这个曲线都应该处于(0, 0)和(1, 1)连线的上方。因为(0, 0)和(1, 1)连线形成的ROC曲线实际上代表的是一个随机分类器。虽然,用ROC curve来表示分类器的performance很直观好用。可是,人们总是希望能有一个数值来标志分类器的好坏。于是Area Under roc Curve(AUC)就出现了。

2 AUC

AUC是一种用来度量分类模型好坏的一个标准。顾名思义,AUC的值就是处于ROC curve下方的那部分面积的大小。通常,AUC的值介于0.5到1.0之间,较大的AUC代表了较好的performance。

AUC的计算方法总结:

AUC的值就是计算出ROC曲线下面的面积

AUC1.png

学习更多编程知识,请关注我的公众号:

代码的路

相关文章
PR曲线、ROC曲线、AUC能干个啥
评判二分类分类器性能的指标有那么多,为什么PR曲线、ROC曲线、AUC值这几个用的比较多。本文从概念、代码实现方面着手进行分享。
PR曲线、ROC曲线、AUC能干个啥
|
6月前
|
数据可视化
R语言中绘制ROC曲线和PR曲线
R语言中绘制ROC曲线和PR曲线
|
6月前
|
数据可视化
R语言中的多项式回归、B样条曲线(B-spline Curves)回归
R语言中的多项式回归、B样条曲线(B-spline Curves)回归
|
数据挖掘
跟着 Cancer Cell 学作图 | 相关性热图(不对称版)
跟着 Cancer Cell 学作图 | 相关性热图(不对称版)
115 0
|
大数据
二分类及多分类ROC和PR曲线绘制
二分类及多分类ROC和PR曲线绘制
529 0
|
Python
科赫曲线
科赫曲线
108 0
|
算法
对分类数据绘制对应的ROC曲线和AUC面积指标
对分类数据绘制对应的ROC曲线和AUC面积指标
278 0
对分类数据绘制对应的ROC曲线和AUC面积指标
使用最小二乘法将xld曲线拟合成直线
使用最小二乘法将xld曲线拟合成直线
408 0
|
数据可视化 数据挖掘 Python
跟着Nature学作图:R语言ggplot2频率分布直方图和散点图添加误差线
跟着Nature学作图:R语言ggplot2频率分布直方图和散点图添加误差线
|
数据可视化 数据挖掘 Python
跟着Nature学作图:R语言ggplot2柱形图添加误差线和频率分布直方图
跟着Nature学作图:R语言ggplot2柱形图添加误差线和频率分布直方图