カットポイントの設定「検証列の作成」レポートのこのセクションでは、カットポイントがどのように決められるかを指定できます。このレポートは、起動ウィンドウでカットポイントの列が指定された場合にのみ表示されます。カットポイントは、以下の4通りの手法のうちのどれかによって決まります。
割合
各セットに対して指定された行数の割合に基づいてカットポイントを決定します。「学習セット」・「検証セット」・「テストセット」の横のボックスには、これらのセットのそれぞれに含めたい割合を入力します。結果的に得られる各セットの実際の大きさは、指定した行数や割合とわずかに異なる場合があります。
行数
各セットに対して指定された行数に基づいてカットポイントを決定します。「学習セット」・「検証セット」・「テストセット」の横のボックスには、これらのセットのそれぞれに含めたい行数を入力します。このオプションでは、各セットを正確に指定できます。
余った行の割り振り先
「カットポイント バッチID」変数の各水準に含まれるデータの行数が異なる場合、各セットの行数を指定するテキストボックスは、「カットポイント バッチID」変数の水準のうち最小行数を含むものでの行数になっています。したがって、各セットの行数を指定した後、「カットポイント バッチID」変数の一部の水準では、特定のセットには割り当てられない余りの行が生じます。このオプションでは、それらの余った行を学習・検証・テストのいずれのセットに割り当てるかどうかを指定します。
時刻または日付の指定
(起動ウィンドウで[カットポイント バッチID]を指定した場合には使用できません。)指定されたカットポイントの列におけるデータ値に基づいてカットポイントを決定します。このオプションを選択した場合は、カットポイントの列の最小値と最大値が参考として表示されます。「学習セット」・「検証セット」・「テストセット」の横のボックスには、これらのセットのそれぞれに含めたい最小値を表す値を入力します。
期間
カットポイントの列における最初のタイムスタンプからの経過時間に基づいてカットポイントを決定します。このオプションを選択した場合は、最初の値から最後の値までの経過時間の合計が参考として表示されます。「学習セット」・「検証セット」・「テストセット」の横のボックスには、これらのセットのそれぞれに含めたい経過時間を表す値を入力します。