- Receiver Operating Characteristic curve,展示不同阈值下分类器的性能变化
- 标注
- M = (TP + FN)表示所有正,m = TP
- N = (FP + TN)表示所有负,n = FP
- 真阳性率为纵轴
- TPR, True Positive Rate
- ,表示正确分类为正样本的比例,即是召回率
- 假阳性率为横轴
- FPR,False Positive Rate
- 为横轴,表示错误分类为正样本的比例
- 预测值为, 表示正样本
- 时,没有正样本
- 时,都是正样本
- 曲线是ROC,向下的面积是AUC
-
- C组合数表示,分类器正类概率比反类概率大的组合
- 对于所有正样本,得分高的正样本排在得分低的正样本之前的情况数之和
- MxN表示所有预测组合
- C组合数表示,分类器正类概率比反类概率大的组合
- AUC越大越好
- 值在0.5到1之间
- 因为是二元分类,在0.5之下可以反向用是一样的
- 一般值在0.7到0.85
-