PR曲線は、カテゴリカルな応答変数をどの程度モデルが適切に分類できるかを評価する方法です。また、これらは分類の閾値を決めるのに用いることもできます。PR曲線は、さまざまな閾値での適合率と再現率をプロットしたものです。適合率(precision; 精度)は、「陽性」(正)として分類したもののなかで、実際に正しく「陽性」(正)だったものの割合です。再現率(recall)は、実際に「陽性」(正)であるもののなかで、「陽性」(正)と分類されたものの割合です。各PR曲線プロットの横には、各応答に対するPR曲線の曲面下面積(AUC; area under curve)が表示されている表があります。PR曲線の曲面下領域は、モデルの全体的な予測性能を要約する指標の1つです。PR曲線の曲線下面積が大きいほど、モデルの予測性能が優れていることを示し、この値が1になるとモデルがデータに完全に適合していることを示します。
PR曲線は、各クラス(応答変数の各水準)の観測数が不均衡である場合に特に役立ちます。この「クラスの不均衡」(class imbalance)は、1つの応答水準での観測数が、他の応答水準の観測数よりもはるかに小さい場合に発生します。これらは、それぞれ少数派クラスおよび多数派クラスと呼ばれます。希少疾患の特定、不正行為の検出、機器の故障など、実用上の多くの場合は、少数派クラスが関心の対象となります。正解率(accuracy)によってモデルの予測性能を評価すると、これらの「クラスの不均衡」が生じているデータにおいて、解釈に誤解を招く可能性があります。例えば、多数派クラスの多くの観測においては、予測性能が良ければ、正解率は高く、全体的な誤分類率は低くなります。しかし、少数派クラスの分類に主な関心がある場合には、正解率や全体的な誤分類率を用いるのは実用的ではありません。PR曲線は、少数派クラスでの予測性能を評価したい場合に役立ちます。また、PR曲線は、実際には「陽性」(正)であるものを誤って「陰性」(負)と分類してしまうこと(つまり、偽陰性が生じること)が重大な問題につながるような場合にも役立ちます。