公開日: 04/01/2021

全体の統計量

学習セットの適合度統計量が表示されます(検証セットやテストセットを指定した場合、それらの適合度等計量も表示されます)。

たとえば、「ブースティングツリーの設定」ウィンドウの[分岐および学習率に対する複数のあてはめ]オプションを使用して、複数のモデルをあてはめたとしましょう。その場合、「全体の統計量」に結果が表示されるのは、応答変数がカテゴリカルな場合には、検証セットの「エントロピーR2乗」値が最大になっているモデルです。一方、応答変数が連続尺度の場合には、「R2乗」値が最大になっているモデルです。

「指標」レポート

(応答変数がカテゴリカルの場合のみ。)学習セットに対して以下の統計量が表示されます(検証セットやテストセットが指定された場合には、それらに対しても同じ統計量が表示されます)。

注: 「エントロピー2乗」と「一般化R2乗」は、値が1に近いほど、適合度が良いことを示します。「平均 -Log p」、「RMSE」、「平均 絶対偏差」、「誤分類率」は、値が小さいほど、適合度が良いことを示します。

エントロピーR2乗

適合度の指標で、現在のモデルと切片だけのモデル(データ全体で確率が一定のモデル)の対数尤度を比較したものです。この指標の範囲は0~1です。エントロピーR2乗を参照してください。

一般化R2乗

この指標は、一般的な回帰モデルに適用できるものです。一般化R2乗は、尤度Lから算出され、最大が1となるように尺度化されています。完全にモデルがデータにあてはまっている場合は1、切片だけのモデルと同等なあてはまりの場合には0になります。一般化R2乗は、通常のR2乗(正規分布に従う連続尺度の応答変数に対する標準最小2乗法のR2乗)を一般化したものです。一般化R2乗は、「NagelkerkeのR2」、または「Craig and UhlerのR2」とも呼ばれており、Cox and Snellの疑似R2を最大が1になるように尺度化したものです。

平均 -Log p

-log(p)の平均です。pは、実際に生じた応答水準に対する予測確率です。

RMSE

誤差の標準偏差(Root Mean Square Error; 誤差平方和を自由度で割ったものの平方根)。誤差は(1-p)で計算されます。ここで、pは、実際に生じた応答水準に対する予測確率です。

平均 絶対偏差

誤差の絶対値の平均。誤差は(1-p)で計算されます。ここで、pは、実際に生じた応答水準に対する予測確率です。

誤分類率

予測確率が最も大きい応答の水準が、観測された水準と一致しない割合。

N

標本サイズ(オブザベーション数)。

混同行列

(応答変数がカテゴリカルの場合のみ。)学習セットにおける分類結果の度数が表示されます。検証セットやテストセットが指定された場合には、それらに対する結果も表示されます。

決定行列

(応答がカテゴリカルであり、かつ応答変数の列に「利益行列」列プロパティがあるか、または[利益行列の指定]オプションを使用して損失を指定した場合にのみ表示されます。)学習セットに対する「決定行列 度数」と「決定行列 割合」が表示されます。検証セットやテストセットが指定された場合には、それらに対する結果も表示されます。パーティションの別例を参照してください。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).