1.结合对性能度量部分的阅读,简述错误率、精度、查准率与查全率的含义。
答:
错误率(Error Rate):是分类错误的样本数占样本总数的比例。
精度(Accuracy):是分类正确的样本数占样本总数的比例。
对于二分类问题,可将样例根据其真实类别与学习器预测类别的组合划分为真正例(true positive)、假正例(false positive)、真反例(true negative)、假反例(false negative)四种情形,令TP、FP、TN、FN分别表示其对应的样例数,则显然有TP+FP+TN+FN=样例总数。分类结果的“混淆矩阵”(confusion matrix)如下所示:
查准率(Precision),又叫准确率,缩写表示用P。查准率是针对我们预测结果而言的,它表示的是预测为正的样例中有多少是真正的正样例。
查全率(Recall),又叫召回率,缩写表示用R。查全率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确。
(注:以上公式均截图自《机器学习》周志华)
2. 数据集包含1000个样本,其中500个正例、500个反例,将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估,试估算共有多少种划分方式?
答:
留出法将数据集划分为两个互斥的集合,为了保持数据的一致性,应该保证两个集合中的类别比例相同。故可以用分层采样的方法。
所以训练集包含350个正例与350个反例,测试集包含150个正例与150个反例。
方式总数:
3.已知分类结果混淆矩阵如下,试计算错误率,精度,查准率,查全率,F1。
真实情况 |
预测结果 |
|
正例 |
反例 |
|
正例 |
100 |
300 |
反例 |
200 |
400 |
答:
错误率:E=FN+FPTP+FN+FP+TN=300+200100+300+400+200=0.5
精度:A=TP+TNTP+FN+FP+TN=100+400100+300+400+200=0.5
查准率:P=TPTP+FP=100100+200=0.333
查全率:R=TPTP+FN=100100+300=0.25
F1:A=2*TPTP+FN+FP+TN+TP-TN=2*1002*100+300+200=0.2857
4.如下所示10个测试样本,’Class’一栏表示每个测试样本的真正标签 (P表示正例;N表示反例),’Score’表示在某分类器中每个测试样本被预测为正样本的概率:
序号 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Class |
P |
N |
N |
P |
P |
N |
N |
P |
P |
N |
Score |
0.93 |
0.85 |
0.80 |
0.7 |
0.55 |
0.50 |
0.40 |
0.3 |
0.2 |
0.1 |
画出ROC 曲线并计算AUC 的值。
答:
Auc = 0.52