精度-召回率曲线提供了一种方式,可用于评估模型对分类响应进行分类的效果。这些曲线还可用于选择分类阈值。精度-召回率曲线绘制各种阈值下的精度值与召回率值之间的关系图。精度定义为预测响应中被正确分类为阳性的比例。召回率定义为实际阳性响应中被正确分类为阳性的比例。在每个精度-召回率曲线图旁边都有一个表,其中包含每个响应的曲线下方的面积。精度-召回率曲线下的面积是一个用于汇总模型总体性能的量度。曲线下的面积越大表示模型性能越好,值为 1 指示完美拟合。
当分类不均衡时,精度-召回率曲线尤其有用。当一个响应水平的观测数远小于另一个响应水平的观测数时,就会出现分类不均衡的情况。它们分别被称为少数类和多数类。在许多情况下,如罕见病鉴定、欺诈检测或设备故障,少数类才是关注的分类。在这些情况下,依赖于预测准确性的分类测量值可能会产生误导。若一个模型预测每个观测的多数类,则可能发生这种情况,它可能具有较低的总体误分类率。不过,若您关注的是如何对少数类中的观测分类,则它将没有任何实际用途。精度-召回率曲线可以帮助专注于预测少数类中的观测的性能。在将阳性响应误分类为阴性(假阴性)响应产生严重后果的情况下,精度-召回率曲线也很有用。