一般化回帰の例
「Diabetes.jmp」は、糖尿病患者442名の測定データで構成されています。関心のある応答Yは、ベースライン時点から1年後の症状進行を定量的に表わしたものです。症状の進行に関連すると思われる10個の変数も、ベースライン時点で測定されています。この例では、一般化回帰手法を使って予測モデルを作成する方法を説明します。
1.
[ヘルプ]>[サンプルデータライブラリ]を選択し、「Diabetes.jmp」を開きます。
3.
「列の選択」リストで「Y」を選択し、[Y]をクリックします。
4.
「年齢」から「グルコース」までを選択し、[マクロ]>[設定された次数まで]をクリックします。
5.
「列の選択」リストで「検証」を選択し、[検証]をクリックします。
6.
「手法」のリストから[一般化回帰]を選択します。
7.
[実行]をクリックします。
8.
[実行]をクリックします。
「適応型Lasso (検証法: 検証列)」レポートが表示されます。「パラメータ推定値の経路」レポート(図5.2 )に、「パラメータ推定値」と「尺度化した負の対数尤度」が表示されます。「尺度化したパラメータ推定値の絶対値の和」が小さくなるほど、パラメータ推定値はより収縮されています。プロットの一番右の推定値は、最尤法による推定値になります。赤い縦線は、指定された検証法によって選択されたパラメータ推定値を表しています。この例で指定された検証法は、「検証」列に定義された値に基づき、学習データと検証データに分割して検証を行っています。
図5.2 「パラメータ推定値の経路」プロット
9.
「元の説明変数に対する推定値」レポート(図5.3 )と「パラメータ推定値の経路」プロットで非ゼロの項が強調表示されます。この時、データテーブルでも対応する列が選択されます。55個のパラメータ推定値のうち、ゼロでないものは6個だけです。なお、「元の説明変数に対する推定値」レポートの最後の行に表示されているのは、正規分布の標準偏差(シグマ、尺度パラメータ)です。
図5.3 「元の説明変数に対する推定値」レポート(一部)