先来解释下面四个的意思:

True Positive (真正, TP)被模型预测为正的正样本;

True Negative(真负 , TN)被模型预测为负的负样本 ;

False Positive (假正, FP)被模型预测为正的负样本;

False Negative(假负 , FN)被模型预测为负的正样本;

真正率:True Positive Rate(TPR)也称为灵敏度(Sensitivity);
TPR = TP /(TP + FN)

真负率:True Negative Rate(TNR)也称为特指度(specificity);
TNR = TN /(TN + FP)

假正率:False Positive Rate (FPR);
FPR = FP /(FP + TN)

假负率:False Negative Rate(FNR);
FNR = FN /(TP + FN)

召回率和精度:

X:系统检索到的相关文档;

Y:系统检索不到的相关文档;

Z:相关但是系统检测不到文档;

W:不相关但是系统检测到文档;

直观的说,一个好的检索系统检索到的相关文档越多越好,不相关文档越少越好.

召回率和精度是衡量信息检索系统性能最重要的参数.

召回率:用检索到相关文档数作为分子,所有相关文档总数作为分母,即 R=X/(X+Z);

精度: 用检索到相关文档数作为分子,所有检索到的文档总数作为分母.即 P=X/(X+Y).;

 

 

 

 

 


版权声明:本文为qq_38842357原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/qq_38842357/article/details/82777757