推定法」のオプション
l1ペナルティ。回帰係数の絶対値の合計を、罰則項とします。
l2ペナルティ。回帰係数の2乗の合計を、罰則項とします。
リッジ回帰の枠組みで、パラメータを推定します。リッジ回帰は、罰則を課した回帰分析の一つで、l2ペナルティを適用します。パラメータ推定値は0になりません。よって、すべての説明変数を常にモデルに含めておきたい場合に役立ちます。詳細は、リッジ回帰を参照してください。
回帰係数の絶対値の和(l1ぺナルティ)を罰則項として、パラメータを推定します。l1ぺナルティがもつ性質により、一部のパラメータ推定値が0になりやすい傾向をもちます。したがって、この推定法は、パラメータの収縮だけではなく、変数選択も同時に行います。通常のLassoは、すべての回帰パラメータに対して均等に罰則を課します。
回帰係数の絶対値を重み付けた和(重み付きのl1ペナルティ)を罰則項として、パラメータを推定します。この罰則項は、モデルが預言的性質をもつように、データから決定されます(Zou, 2006)。このオプションは、最尤推定値を使ってl1ペナルティに重みを付けます。なお、説明変数の数が標本サイズより多い場合や、説明変数間に1次従属性がある場合、最尤推定値は計算できません。そのような状況のために最尤推定値が計算できない場合、一般化逆行列またはリッジ回帰の解がl1ペナルティの重みとして使用されます。適応型手法を参照してください。
l1ペナルティとl2ペナルティの両方を組み合わせたものを罰則項として、パラメータを推定します。l1ペナルティは、変数選択の性質をもちます。一方、l2ペナルティは、リッジ回帰と同じ性質をもちます。
l1ペナルティとl2ペナルティの両方を組み合わせ、かつ、適応型の罰則項を用いて、パラメータを推定します。このオプションは、最尤推定値を使ってl1ペナルティに重みを付けます。なお、説明変数の数が標本サイズより多い場合や、説明変数間に1次従属性がある場合、最尤推定値は計算できません。そのような状況のために最尤推定値が計算できない場合、一般化逆行列またはリッジ回帰の解がl1ペナルティの重みとして使用されます。「弾性ネットのアルファ」の値は、「詳細設定」パネルで設定することができます。適応型手法を参照してください。
詳細設定
使われる調整パラメータ値の範囲は、ほとんどの場合、ゼロを下限とします。また、切片以外のパラメータ推定値がゼロになる調整パラメータの最小値を、調整パラメータ値の上限に設定します。調整パラメータ値の下限は、次の2つのケースでは0.01に設定されますが、それ以外ではゼロに設定されます。
このオプションをオンにすると、「高次の効果を追加する場合、その効果に関連する低次の効果を先にモデルに追加しておく」という制約を課します。このオプションをオンにすると、ほとんどの場合、モデルにXがなければ、X2も含まれません。しかし変数増加法を除く推定法では、1つのステップでX2がモデルに含まれ、Xが除外されることもあります。データテーブルにDOEスクリプトが含まれる場合は、このオプションが有効になりますが、デフォルトでは無効です。
弾性ネットのaパラメータを設定します。このaパラメータが、弾性ネットを推定する際のl1およびl2ペナルティに対する比重を決定します。デフォルトの値はa = 0.9で、これはl1ペナルティに対する重みを0.9、l2ペナルティに対する重みを0.1に設定します。このオプションは、「推定法」で[弾性ネット]を選択した場合にのみ使用できます。推定法の統計的詳細を参照してください。
ダブルLassoと2段階変数増加法の第1段階において、どのようにモデルを選択するかを指定します。デフォルトでは、指定された検証方法に基づいて最良と判断されたモデルが選択されます。最良のモデルよりもl1ノルムがやや大きい、または、やや小さいモデルを選択することもできます。ただし、選択されるモデルは、緑色や黄色のゾーンにあることが条件です。たとえば、[黄色ゾーンで最小]を選択すると、黄色ゾーンで最小のl1ノルムを持つモデルが解として表示されるようになります。同等なモデルのゾーンを参照してください。
「パラメータ推定値の経路」レポートに最初に表示されるモデルをどのように選択するかを指定します。グラフにて、縦の実線で表されている個所が現在のモデルを示します。現在のモデルを示す縦線を参照してください。最良のモデルは、縦の点線として表示されます。デフォルトでは、指定された検証方法に基づいて最良と判断されたモデルが選択されます。
最良のモデルよりもl1ノルムがやや大きい、または、やや小さいモデルを選択することもできます。ただし、選択されるモデルは、緑色や黄色のゾーンにあることが条件です。たとえば、[黄色ゾーンで最小]を選択すると、黄色ゾーンで最小のl1ノルムを持つモデルが解として表示されるようになります。同等なモデルのゾーンを参照してください。
検証法」のオプション
データがk個に分割されます。
こうして、検証セットから、k個の対数尤度が求められます。そして、それらの平均が求められます。この平均が、検証のための対数尤度として使用されます。
調整パラメータの各値のうちで、この対数尤度が最大となっているものが、最終的なモデルを求めるのに使われます。まず、調整パラメータが最適値となっているときに求められたk個のモデルそれぞれを、データセット全体にあてはめます。そして、その中から、対数尤度が最も大きいものが最終的なモデルに選ばれます。この最終的なモデルで使われた分割に基づいて、各セットは「学習セット」と「検証セット」に分類されます。これらの「学習セット」と「検証セット」は、診断プロットで使用されます。
早期打ち切り
実行
[実行]をクリックすると、分析結果のレポートが開きます。レポートのタイトルには、選択した推定法と検証法が記載されています。一度、分析を実行した後にでも、「モデルの設定」パネルに戻って、別の推定法や検証法を選択して、追加の分析を行えます。