这里面有三个常用的概念:正确率,精确率,召回率。
正确率(Precision,简称为P)定义为:P=返回结果中相关文档个数/返回结果的数目。
精确率(accuracy,简称为A)定义为:A=判断结果正确的文档数目/所有文档数目。
召回率(Recall,简称为R)定义为: R=返回结果中相关文档数目/所有相关文档数目。
实际相关文档数 | 实际不相关文档数 | |
---|---|---|
返回文档数(搜索引擎认为相关) | tp | fp |
未返回文档数(搜索引擎认为不相关) | fn | tn |
P=tp/(tp+fp)
A=(tp+tn)/(tp+fp+fn+tn)
R=tp/(tp+fn)
出自:https://www.cnblogs.com/haolujun/archive/2013/01/09/2852511.html
本文转自whk66668888 51CTO博客,原文链接:http://blog.51cto.com/12597095/2072410