図3.4 「モデルの設定」パネル
[実行]をクリックしてモデルをあてはめた後も、「モデルの設定」パネルを開いて設定を変更すれば、別のモデルをあてはめることができます。
予測能力の最終評価に使うデータを、テストセットといいます。検証列を指定した場合のみ、テストセットを使用できます。
xはX変数の線形結合です。
xはX変数の線形結合です。
ブースティングは、複数の小さいモデル(基底モデル)を逐次的にあてはめていき、それらの結果を合わせて、加法的な大きなモデルを構築する手法です。ブースティングでは、小さなモデルをあてはめて、その残差(尺度化した残差)が計算されます。その残差に対して、また、小さなモデルをあてはめます。この処理を繰り返します。最後に、小さなモデルを組み合わせて、最終的なモデルを作成します。検証セットによってモデルを評価して、小さいモデルをあてはめる回数を決めます(指定した回数を超えた場合は、そこで終了します)。
学習率は0 < r £ 1の範囲で設定します。学習率が1に近い値だと、最終モデルへの収束が速くなりますが、データにオーバーフィットしやすくなります。「モデル数」に少ない数を指定した場合には、学習率を1に近い値に設定してください。
モデルに関するオプションの[変換した共変量の保存]オプションを参照してください。
ペナルティはという式で表されます。lはペナルティパラメータ、p( )はパラメータ推定値の関数(ペナルティ関数)です。ペナルティパラメータの最適値は、検証セットで評価することにより推定されます。