机器学习基础(一)
混淆矩阵
混淆矩阵如下图:这里以是否有心脏病举例(二分类举例),列代表机器学习算法所做的预测,有心脏病还是没有心脏病,行代表实际的情况。
真阳性,真阴性,假阳性,假阴性
真阳性(TP):病人有心脏病,且被算法正确的预测出有。
真阴性(TN):病人无心脏病,且被算法正确的预测出无。
假阴性(FN):病人有心脏病,但被算法预测成无,将原本的阳性预测成阴性,预测错误,所以是假阴性。
假阳性(FP):病人无心脏病,但被算法预测成有,将原本的阴性预测成阳性,所以是假阳性。
敏感性,特异性
Sensitivity敏感性(真阳性率,True Positive Rate = TPR)是指以所有的真实的阳性为条件,预测结果也为阳性的概率。
公式如下
在这个例子中,是指被正确识别带有心脏病人的百分比。
Specificity特异性(真阴性率,True negative Rate = TNR)是指以所有真实的阴性为条件,预测结果也为阴性的概率。
在这个例子中,是指正确识别不带有心脏病人的百分比。
如果识别阳性重要,则要选择高敏感性的方法,及Sensitivity高,预测准确阳性的概率更高。
如果识别阴性重要,则要选择高特异性的方法,及Specificity高,预测准确阴性的概率更高。
版权声明:本文为syucsdn原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。