いくつかの人体測定値の関数として体脂肪率を予測するモデルを作成してみましょう。次の手順に従ってニューラルネットワークモデルを作成します。
1. [ヘルプ]>[サンプルデータフォルダ]を選択し、「Body Fat.jmp」を開きます。
2. [分析]>[予測モデル]>[ニューラル]を選択します。
3. 「体脂肪率」を選択し、[Y, 目的変数]をクリックします。
4. 他のすべての列(「年齢」から「手首囲(cm)」までを選択し、[X, 説明変数]をクリックします。
5. [OK]をクリックします。
6. 「検証データ抽出確率」に「0.2」と入力します。
7. 「乱数シード値」に「1234」と入力します。
メモ: 検証セットが無作為に抽出されるため、一般に、結果は図とは異なります。上記のシード値を入力すると、この例で示す結果を再現できるようになります。
8. 「説明変数の変換」オプションをオンにします。
9. [実行]をクリックします。
図3.3 「ニューラル」レポート
学習セットと検証セットの両方に対し、結果が表示されます。検証セットの結果を見ると、得られたニューラルネットワークが将来のデータをどれぐらい予測できるかが分かります。
検証セットの「R2乗」統計量は0.792です。この値は、モデルが体脂肪率の予測において良好な予測性能を示しており、検証セット内においてモデルの予測値が実測値に近いことを示しています。
10. 「モデル NTanH(3)」の赤い三角ボタンをクリックし、[予測値と実測値のプロット]を選択します。これにより、モデルの適合性評価をさらに見ることができます。
図3.4 予測値と実測値のプロット
点が回帰直線上に並んでいることから、予測値が実測値に近いことがわかります。
11. X変数が予測値に与える影響を把握するため、「モデル NTanH(3)」の赤い三角ボタンのメニューから[プロファイル]を選択します。
12. 「予測プロファイル」の赤い三角ボタンをクリックし、[表示方法]>[複数行に配置]を選択します。
13. 「1行に何個のプロットを配置しますか?」の横のフィールドに「7」と入力します。
図3.5 予測プロファイル
変数の中には、プロファイルの傾きが正のものと負のものがあります。たとえば、変数の「体重(ポンド)」は傾きが正です。これは、体重が重いほど「体脂肪率」の水準が高いことを示しています。変数の「身長(インチ)」は、インチ単位で測定された参加者の身長です。この変数には負の傾きがあり、「身長(インチ)」が増加するにつれて、予測される「体脂肪率」が減少する傾向があることを示しています。