「モデルのあてはめ」プラットフォームの[標準最小2乗]手法を使って、二元配置分散分析を行います。そして、説明変数の値によって、予測値がどのように変化するかを調べます。
1. [ヘルプ]>[サンプルデータフォルダ]を選択し、「Analgesics.jmp」を開きます。
2. [分析]>[モデルのあてはめ]を選択します。
3. 「痛みの程度」を選択し、[Y]をクリックします。
4. 「性別」と「薬」を選択し、[追加]をクリックします。
5. [実行]をクリックします。
6. 「応答 痛みの程度」の赤い三角ボタンをクリックし、[因子プロファイル]>[プロファイル]を選択します。
表示される各レポートの内容を以下に説明していきます。
てこ比プロットは、現在の回帰モデルの結果に大きな影響を与えているデータ点を探し出すのに用います。
図4.8 因子の「てこ比プロット」と「最小2乗平均表」
特に影響力の大きいデータ点は見られません。「性別」と「薬」の両方において、予測値の線が水平ではないこと、かつ、各水準に応じて最小2乗平均の値が変化することから、性別と薬の両方が応答に何らかの影響を及ぼしていると判断できます。
「予測値と実測値のプロット」では、「痛みの程度」の実測値と予測値を比較することで、モデルの予測性能や予測精度を評価できます。
図4.9 予測値と実測値のプロット
このプロットと、p値が0.0006であることから、実測値と予測値の間の関係は統計的に有意であることが示されています。
「あてはめの要約」表では、モデルの適合度や応答変数の統計量を評価できます。「あてはめの要約」表には、モデルの適合度や応答変数の統計量が表示されています。「分散分析」表には、モデル全体の統計的な有意性や変動の要因が示されます。「あてはまりの悪さ(LOF)」表には、モデルの適合度や誤差の評価に関する情報が示されています。「パラメータ推定値」表には、回帰係数の点推定値・その標準誤差・そのp値などが示されています。「効果の検定」表には、個々の説明変数に対するp値が示されています。「予測値と残差のプロット」表では、残差のパターンや傾向を確認することで、回帰モデルの仮定や性能を評価できます。
図4.10 モデルの要約、分散分析、パラメータ、残差
この表では、回帰モデルのR2乗値が0.444になっています。「性別」および「薬」の「効果の検定」では、これらの因子が両方とも統計的に有意であることが示されています(p値が0.05未満)。
「予測プロファイル」では、説明変数の値に応じて応答の予測値がどのように変化するかを調べることができます。
図4.11 予測プロファイル
薬Aを使用した女性の場合、「痛みの程度」の予測値は6.23で、95%信頼区間は4.88~7.57です。「予測プロファイル」で、「性別」および「薬」の水準の組み合わせを変えたときに、応答の予測値がどのように変化するかを対話的に調べることができます。因子の水準の組み合わせを変えたときの「痛みの程度」の予測値の変化を視覚的に確認するには、「性別」の水準と「薬」の水準をそれぞれクリックします。
ヒント: 予測区間を描画するには、「予測プロファイル」の赤い三角ボタンのメニューにある[予測区間]オプションを選択します。予測区間は信頼区間より幅広くなっています。予測区間は、モデルを推定した現在のデータではなく、将来のデータにおける1個の観測値に対する区間となっています。