このバージョンのヘルプはこれ以降更新されません。最新のヘルプは https://www.jmp.com/support/help/ja/15.2   からご覧いただけます。


<検証法の名前>による検証手法 = <PLS法の名前>
図6.9 交差検証のレポート
[Xの標準化]オプションが選択されている場合、標準化はデータテーブル全体に対して一度だけ適用され、 個々の学習セットには再適用されません。ただし、[中心化][尺度化]のオプションが選択されている場合は、交差検証における中心化や尺度化は各学習セットに適用されます。これらのオプションが選択されている場合は、それぞれ個別に中心化や尺度化された学習セットによって交差検証が進められます。
この検定統計量は、各モデルが最適なモデルと有意に異なるかどうかを検定するためのものです。それぞれのvan der Voet T2検定の帰無仮説は、「この因子数に基づくモデルは、最適なモデルと異ならない」です。対立仮説は「モデルは最適なモデルと異なる」です。詳細については、第 “van der Voet のT2を参照してください。
van der Voet T2検定のp値。詳細については、第 “van der Voet のT2を参照してください。
Q2
詳細については、第 “Q2の計算”を参照してください。
当該の因子数以下であるモデルがもつ予測能力の指標。因子数fに対し、累積Q2は次のように計算されます。
この式で、PRESSiSSYiは、因子数がiであるモデルの統計量です。
R2X
当該の因子によって説明されるXの変動の割合。R2Xの値が大きい成分は、X変数の変動の大半を説明します。第 “検証が使用された場合のR2XとR2Yの計算”を参照してください。
当該の因子数のモデルによって説明されるXの変動の割合。i = 1から当該の因子数までのR2Xの合計。
R2Y
当該の因子によって説明されるYの変動の割合。R2Yの値が大きい成分は、Y変数の変動の大半を説明します。第 “検証が使用された場合のR2XとR2Yの計算”を参照してください。
当該の因子数のモデルによって説明されるYの変動の割合。i = 1から当該の因子数までのR2Yの合計。
Q2および累積R2Yの解釈
Q2と累積R2Yは両方ともモデルの予測能力を測定する統計量ですが、その性質は異なります。
累積R2Yは、因子数が増えるにつれて増加します。これは、より多くの因子がモデルに追加されるにつれて、より多くの変動が説明されるからです。
Q2の場合は、因子数が増えるにつれて増加した後、減少するか少なくとも増加を止めます。これは、より多くの因子が追加されるにつれてモデルは学習セットに合わせられ、新しいデータに対して適切に一般化されないため、PRESS統計量が減少するからです。
モデルにいくつの因子を含めるかを決定するときに、van der Voet検定の代わりに、Q2と累積R2Yを用いることもできます。それには、Q2値が大きく、減少が始まっていない時点での因子数を選択します。また、累積R2Y値も大きくなっているモデルを選択することも考えられます。
「Penta.jmp」の累積R2YとQ2は、「Penta.jmp」データテーブルの累積R2YとQ2を、因子数に対してプロットしたものです。検証法には「1つ取って置き法」を使用しています。累積R2Yは、因子数4のあたりまで増加し、その後は平らになっています。Q2は、因子数2で最も大きく、その後は平らになっています。このプロットから、因子数2のモデルがYの変動の多くを説明し、データに対するオーバーフィットも回避することがわかります。
図6.10 「Penta.jmp」の累積R2YとQ2
因子数aに対するPRESS平均平方根は、次のように計算されます。
1.
a個の因子のモデルが各学習セットにあてはめられます。
4.
A 個の因子の「PRESS平均平方根」は、すべての応答のPRESSの値を平均し、その平方根を求めたものです。
5.
Y変数が複数ある場合には、第 3 步で得られたPRESS統計量を全応答変数で平均したものが使われます。
Q2の計算
Q2は、1 - PRESS / SSYという式で計算される統計量です。この式で、PRESSは、学習データから推定されたモデルを検証セットで評価したときの予測誤差平方和を、全応答変数で平均したものです。SSYは、検証セットにおけるYの平方和を、全応答変数で平均したものです。
「交差検証」レポートのQ2は、選択した「検証法」に応じて、次のように計算されます。
1つ取って置き法でのQ2は、オブザベーションを一度に1つずつ除外することで構築したモデルを各検証セットに適用して計算された1 - PRESS / SSYの平均です。
K分割法のQ2は、K個に分割したデータのうちの1つを除外することで構築したk個のモデルを各検証セットに適用して計算された1 - PRESS / SSY の平均です。
保留法や検証列を用いた場合のQ2は、1つの学習セットから構築されたモデルを検証セットに適用して計算された1 - PRESS / SSY です。
「交差検証」レポートのR2XとR2Yは、選択した「検証法」に応じて、次のように計算されます。
メモ: なお、R2Yも、以下の説明と同様に計算されます。
1つ取って置き法のR2Xは、オブザベーションを一度に1つずつ除外することで構築したモデルの「Xの説明される変動(%)」の平均です。
K分割法のR2Xは、K個に分割されたデータのうち1つの分割を順に除外することで構築したモデルの「Xの説明される変動(%)」の平均です。
保留法や検証列を用いた場合のR2Xは、学習データを使用して構築したモデルの「Xの説明される変動(%)」です。