基本的な回帰モデル > 一般化回帰モデル > あてはめたモデルに対するオプション

公開日: 04/01/2021

あてはめたモデルに対するオプション

モデルをあてはめた結果に関する各レポートには、それぞれ赤い三角ボタンのメニューがあり、次のようなオプションが用意されています。

警告: データタイプが［式］である列や、尺度が［ベクトル］である列を起動ダイアログで指定した場合、ここで説明する多くのオプションは使用できません。

回帰レポート

現在のモデルに対する推定結果について、どの表やグラフを表示するかを指定します。デフォルトでは、以下のレポートのうち、「標準化した説明変数に対する推定値」レポートと「非ゼロの推定値」レポートを除くすべてが表示されます。

モデルの要約

モデルの指定や適合度統計量に関する情報を含んだ「モデルの要約」レポートを表示します。このオプションは、該当するモデルの場合に「推定値の詳細」レポートも表示します。モデルの要約および推定値の詳細を参照してください。

パラメータ推定値の経路

（最尤法の結果では使用できません。）経路プロットと検証プロットを表示します。パラメータ推定値の経路を参照してください。

標準化した説明変数に対する推定値

標準化したパラメータ推定値の表を表示します。標準化した説明変数に対する推定値を参照してください。

元の説明変数に対する推定値

元のデータにおけるパラメータ推定値の表を表示します。元の説明変数に対する推定値を参照してください。

非ゼロの推定値

（最尤法とリッジ回帰の結果では使用できません。）現在選択されているモデルのアクティブな（ゼロでない）パラメータ推定値の表を表示します。

パラメータ推定値の経路の要約を表示

（最尤法とリッジ回帰の結果では使用できません。）経路プロットと検証プロットで、効果のある変数が変化する位置の点に対する適合度統計量の表を表示します。表示される統計量は、推定法によって異なります。「Lasso (検証法: BIC, 分布: 正規)」で表示される「モデルの条件付き確率」の詳細については、Hu et al.（2019）を参照してください。

効果の検定

各効果の検定を表示します。ここで行われる検定は、「該当する効果に関連するすべてのパラメータが0である」という帰無仮説を検定するものです。名義尺度や順序尺度の効果では、3水準以上の場合には、複数のパラメータを持ちます。その場合、「すべての関連パラメータが0である」を帰無仮説とした検定が行われます。応答変数の確率分布として分布が多項分布を選択した場合、応答変数の水準全体にわたってまとめた検定が行われます。効果の検定を参照してください。

予測式の表示

モデルの予測式を含んだ「予測式」レポートを表示します。例については、予測式の表示を参照してください。

非ゼロの項を選択

レポートにおいて、パラメータ推定値がゼロではない項を強調表示します。この時、データテーブルでも対応する列が選択されます。このオプションは、「推定法」で［リッジ回帰］を選択した場合は使用できません。

ゼロの項を選択

レポートにおいて、パラメータ推定値がゼロとなっている項を強調表示します。この時、データテーブルでも対応する列が選択されます。このオプションは、「推定法」で［リッジ回帰］を選択した場合は使用できません。

非ゼロの効果を使って再起動

（尺度が［ベクトル］である説明変数が含まれている場合には使用できません。）「モデルのあてはめ」起動ウィンドウを開くためのオプションが含まれています。開かれた「モデルのあてはめ」起動ウィンドウの「モデル効果の構成」リストには、パラメータ推定値がゼロではない効果に基づく項（アクティブな効果）が表示されます。「モデルのあてはめ」起動ウィンドウのその他の設定は、元の分析と同じです。

注: By変数を含むレポートで「非ゼロの効果を使って再起動」のいずれかのオプションを選択した場合、By変数は「モデルのあてはめ」起動ウィンドウに追加されません。

非ゼロの効果を使って再起動

「モデル効果の構成」リストに、非ゼロの効果のみが表示されます。

非ゼロの主効果とその2次交互作用で再起動

「モデル効果の構成」リストに、非ゼロの効果とその2次交互作用が表示されます。

非ゼロの主効果とその3次交互作用で再起動

「モデル効果の構成」リストに、非ゼロの効果とその3次交互作用が表示されます。

非ゼロの主効果とその完全実施要因で再起動

「モデル効果の構成」リストに、非ゼロの効果とその完全実施要因が表示されます。

非ゼロの主効果とその2次多項式で再起動

「モデル効果の構成」リストに、非ゼロの効果とその2次多項式が表示されます。

非ゼロの主効果とその3次多項式で再起動

「モデル効果の構成」リストに、非ゼロの効果とその3次多項式が表示されます。

非ゼロの主効果とその応答曲面モデルで再起動

「モデル効果の構成」リストに、非ゼロの効果とその応答曲面モデルが表示されます。

アクティブでない経路を非表示

「パラメータ推定値の経路」プロット内のアクティブでない経路の透明度を調整し、現在アクティブでない経路をグレーで表示します。

オッズ比

（応答変数の確率分布として二項分布を指定し、かつ、モデルに切片がある場合のみに使用可能。また、尺度が［ベクトル］である説明変数が含まれている場合には使用できません。）カテゴリカルな説明変数に対してオッズ比、および、連続尺度の説明変数に対して単位オッズ比と範囲オッズ比を求めます。オッズ比とは、2つのオッズの比を指します。あるイベントが起こる確率を、そのイベントが起こらない確率で割ったものをオッズといいます。応答変数におけるどちらの水準をイベントとみなすかは、「モデルのあてはめ」起動ウィンドウの「イベントを示す水準」で指定できます。

カテゴリカルな説明変数の一つひとつに対し、「オッズ比」レポートが作成されます。カテゴリカルなモデル項に対しては、水準のすべての組み合わせに対するオッズ比が計算されます。

連続尺度の説明変数がある場合は、2つのレポートが追加されます。

– 「単位オッズ比」レポート。単位オッズ比は、連続尺度のモデル項が1単位だけ変化したときのオッズ比です。

– 「範囲オッズ比」レポート。範囲オッズ比は、連続尺度のモデル項が最小値から最大値まで変化したときのオッズ比です。

「オッズ比」レポートの信頼区間は、Wald法によって計算されます。あるモデル項のオッズ比は、そのモデル項よりも高次の項がない場合にのみ、意味を持ちます。

注: モデルに交互作用がある場合、「多重比較」オプションによってオッズ比を求めることができます。多重比較を参照してください。

発生率比

（応答変数の確率分布としてPoisson分布または負の二項分布を指定し、かつモデルに切片がある場合のみ使用可能。）カテゴリカルな説明変数に対して発生率比、および、連続尺度の説明変数に対して単位発生率比と範囲発生率比を求めます。発生率比とは、2つの発生率の比を指します。発生率とは、ある特定の期間や領域において生じるイベントの発生回数を指します。

カテゴリカルな説明変数の一つひとつに対し、「発生率比」レポートが作成されます。カテゴリカルなモデル項に対しては、水準のすべての組み合わせに対する発生率比が計算されます。

連続尺度の説明変数がある場合は、2つのレポートが追加されます。

– 「単位発生率比」レポート。単位発生率比は、連続尺度のモデル項が1単位だけ変化したときの発生率比です。

– 「範囲発生率比」レポート。範囲発生率比は、連続尺度のモデル項が最小値から最大値まで変化したときの発生率比です。

「発生率比」レポートの信頼区間は、Wald法によって計算されます。あるモデル項の発生率比は、そのモデル項よりも高次の項がない場合にのみ、意味を持ちます。

ハザード比

（［Cox比例ハザード］分布を指定し、モデルに切片がある場合のみ使用可能。）カテゴリカルな説明変数に対してハザード比、および、連続尺度の説明変数に対して単位ハザード比と範囲ハザード比を求めます。ハザード比は、2つのハザード（瞬間故障率）の比を指します。時点tにおけるハザードは、その時点tまでに生存していた個体のなかで、時点tにおいて死亡するもの確率（条件付き確率）です。

カテゴリカルな説明変数の一つひとつに対し、「ハザード比」レポートが作成されます。カテゴリカルなモデル項に対しては、水準のすべての組み合わせに対するハザード比が計算されます。

連続尺度の説明変数がある場合は、2つのレポートが追加されます。

– 「単位ハザード比」レポート。単位ハザード比は、連続尺度のモデル項が1単位だけ変化したときのハザード比です。

– 「範囲ハザード比」レポート。範囲ハザード比は、連続尺度のモデル項が最小値から最大値まで変化したときのハザード比です。

「ハザード比」レポートの信頼区間は、Wald法によって計算されます。あるモデル項のハザード比は、そのモデル項よりも高次の項がない場合にのみ、意味を持ちます。

推定値の共分散

パラメータ推定値の共分散行列を表示します。この共分散行列は、M推定におけるサンドイッチ公式を使って求められます（Zou, 2006およびHuber and Ronchetti, 2009）。共分散行列には、ゼロの項は含まれません。

推定値の相関

パラメータ推定値の相関行列を表示します。この相関行列は、M推定におけるサンドイッチ公式を使って求められます（Zou, 2006およびHuber and Ronchetti, 2009）。相関行列には、ゼロの項は含まれません。

逆推定

（尺度が［ベクトル］である説明変数が含まれている場合には使用できません。）指定されたYの値（および、その他のXの値）に対応する、Xの値を予測します。逆推定は、説明変数が連続尺度のものにしか行えません。逆推定の詳細は、逆推定を参照してください。

多重比較

（尺度が［ベクトル］である説明変数が含まれている場合や、カテゴリカルな説明変数が含まれていない場合には使用できません。）「多重比較」起動ウィンドウを表示します。「多重比較」起動ウィンドウとレポートの詳細については、多重比較を参照してください。多重比較は、モデルの線形成分に対して行われます。応答変数の確率分布として二項分布を指定した場合には、比較の結果はオッズ比に対して示されます。応答変数の確率分布としてPoisson分布を指定した場合には、比較の結果は発生率比に対して示されます。［Cox比例ハザード］分布を指定した場合、比較の結果はハザード比に対して示されます。

混同行列

（［二項］分布、［多項］分布、［順序ロジスティック］を指定した場合のみ使用可能。）応答変数の実測値と予測値を2元度数表の形式で表示します。適合度が良いモデルは、予測値が実測値と一致しています。混同行列を見ると、モデルがどれぐらい精確に応答を分類しているかを知ることができます。検証セットやテストセットを使用した場合、学習セット、検証セット、テストセットのそれぞれに対して混同行列が表示されます。

確率に対する閾値の設定

（応答変数の確率分布として二項分布を指定した場合のみ使用可能。）応答の分類に閾値となる確率を指定します。デフォルトでは、予測確率が0.5を上回るものが「イベントを示す水準」に分類されます。「イベントを示す水準」に分類するための閾値を0.5以外の値にするには、閾値を変更してください。閾値を変更すると、その変更された閾値が分類に適用され、混同行列が更新されます。

応答変数の列に「利益行列」列プロパティが指定されている場合には、確率の閾値の初期値は、その利益行列によって決められます。

プロファイル

（尺度が［ベクトル］である説明変数が含まれている場合には使用できません。）あてはめたモデルを探索するための各種プロファイルを作成します。

注: 行数が500以下で説明変数の数が30以下である場合、「パラメータ推定値の経路」レポートにあるいずれかのプロットで現在のモデルを示す縦線をドラッグすると、マウスの移動に即座に連動して、プロファイルは更新されます。それ以外の場合は、マウスボタンを放した時点でプロファイルは更新されます。

プロファイル

予測プロファイルを表示します。パラメータ推定値がゼロであり、かつ説ゼロでない交互作用のいずれにも関与していない説明変数は、プロファイルに表示されません。予測プロファイルの詳細については、『プロファイル機能』のプロファイルを参照してください。

分布プロファイル

（「分布」として［二項］または［分位点回帰］を指定した場合は使用できません。）説明変数と応答変数の関数として累積確率を示すプロファイルを表示します。応答変数は一番右のセルに表示されます。

分位点プロファイル

（「分布」として［二項］または［分位点回帰］を指定した場合は使用できません。）説明変数と累積確率の関数として分位点を示すプロファイルを表示します。分位点の累積確率は「確率」として一番右のセルに表示されます。

生存確率プロファイル

（「分布」として［正規］・［指数］・［Weibull］・［対数正規］・［Cox比例ハザード］を指定した場合のみ使用可能。）説明変数と応答変数の関数として生存率を示すプロファイルを表示します。応答変数は一番右のセルに表示されます。

ハザードプロファイル

（「分布」として［正規］・［指数］・［Weibull］・［対数正規］・［Cox比例ハザード］を指定した場合のみ使用可能。）説明変数と応答変数の関数としてハザード（瞬間故障率）を示すプロファイルを表示します。応答変数は一番右のセルに表示されます。

カスタム検定

ユーザーが定義した仮説を検定できる「カスタム検定」レポートを表示します。モデルに「パラメータ推定値の経路」がある場合、それを更新するとカスタム検定の結果も更新されます。カスタム検定の詳細については、カスタム検定を参照してください。「カスタム検定」の赤い三角形のメニューには、「カスタム検定」レポートを削除するオプションがあります。

診断プロット

現在のモデルの適合度を評価するための各種プロットを表示します。「検証」列を指定した場合、または、「検証法」として［K分割］・［保留］・［1つ取って置き法］のいずれかを選択した場合は、以下のオプションによって学習セット・検証セット・テストセットを表示したり、それらのセットごとに個別のグラフを描いたりできます。「検証法」として［K分割］・［1つ取って置き法］を選択した場合、ここに描かれるプロットは、最小の予測誤差を持つ分割の学習セットと検証セットを用います。K分割を参照してください。

注: どの診断プロットも、いずれかの「パラメータ推定値の経路」プロットで縦線をドラッグすると、即座に更新されます。

各種のモデル診断

（［二項］・［多項］・［順序ロジスティック］・［Cox比例ハザード］を指定した場合は使用できません。）「予測値と残差のプロット」、「行番号と残差のプロット」、「残差のヒストグラム」、「より大きな応答を観測する確率」の4つのグラフを表示します。

これらのグラフは、すべてのデータを用いて作成されます。「検証」列を使用した場合、または、「検証法」として［K分割］・［保留］・［1つ取って置き法］のいずれかを選択した場合は、チェックボックスによって学習セット・検証セット・テストセットを選択できます。これらのセットに対応する行がデータテーブル内で選択され、対応する点や領域がグラフ内で強調表示されます。このオプションは、セット間でモデルの適合度に差がないかどうかを特定したいときに便利です。

「より大きな応答を観測する確率」のヒストグラムは、モデルの適合度の評価に役立ちます。「分布」に対する指定によって、判断の仕方が異なります。

– ゼロ強調分布と分位点回帰以外の分布の場合、あてはめたモデルが正しければ、ヒストグラムはほぼ一様分布となります。

– ゼロ強調分布の場合、あてはめたモデルが正しければ、ヒストグラムのゼロの位置に点の塊が見られ、他の個所ではほぼ一様分布になります。

– 分位点回帰の場合、あてはめたモデルが正しければ、ヒストグラムの指定の分位点から左側でほぼ一様分布となり、また、右側でもほぼ一様分布となります。

ベースラインの生存曲線とハザード曲線

（［Cox比例ハザード］分布を指定した場合のみ使用可能。）ベースライン生存関数とハザード関数を、応答変数に対してプロットしたグラフを表示します。このグラフの下には、このグラフで使われた数値の表が表示されます。

注: ［Cox比例ハザード］分布を指定した場合、［ベースラインの生存曲線とハザード曲線］以外の診断プロットは作成されません。

ROC曲線

（「分布」に［二項］・［多項］・［順序ロジスティック］を指定した場合のみ使用可能。）受診者動作特性（ROC; Receiver Operating Characteristic）曲線を表示します。検証セットやテストセットを用いた場合には、それらのセットにおけるROC曲線も表示されます。

ROC曲線は、あてはめたモデルが応答水準をどれだけ適切に分類できるかを示します。ROC曲線が対角線から離れているほど、適合度が良いことを表します。ROC曲線の概要については、『基本的な統計分析』のROC曲線を参照してください。

応答に3つ以上の水準がある場合、「ROC曲線」プロットには、それらの水準ごとにROC曲線が描かれます。水準ごとのROC曲線は、その水準に正しく分類されるかどうかを示しています。ROC曲線の詳細については、『予測モデルおよび発展的なモデル』のROC曲線を参照してください。

リフトチャート

（「分布」に［二項］・［多項］・［順序ロジスティック］を指定した場合のみ使用可能。）モデルのリフトチャートを表示します。検証セットやテストセットを用いた場合には、それらのセットにおけるリフトチャートも表示されます。

リフトチャートは、予測確率を降順に並べて見ていったときに、応答変数における特定の水準がどれぐらい適切に予測されるかを示します。リフトチャートの横軸は、予測確率を降順にプロットしたものです。リフトチャートの縦軸は、応答変数の興味があるほうの水準に関して、横軸の予測確率以上となっているグループで正しく分類されている割合を、全体の割合で割ったものです。リフトチャートは、予測確率が特定の閾値を超えるものだけを選択した場合に、そこでどれぐらい適切に予測が行えているかを示しています。

応答に3つ以上の水準がある場合、「リフトチャート」プロットには、水準ごとの曲線が表示されます。水準ごとの曲線は、その水準に正しく分類されるかどうかを示すリフトチャートです。リフトチャートについての詳細は、『予測モデルおよび発展的なモデル』のリフトチャートを参照してください。

予測値と実測値のプロット

（「分布」に［二項］・［多項］・［順序ロジスティック］・［Cox比例ハザード］を指定した場合は使用できません。）Yの実測値を縦軸、予測値を横軸にプロットしたものです。検証セットやテストセットを用いた場合には、それらのセットにおけるプロットも表示されます。

予測値と残差のプロット

（「分布」に［二項］・［多項］・［順序ロジスティック］・［Cox比例ハザード］を指定した場合は使用できません。）残差を縦軸、Yの予測値を横軸にプロットしたものです。検証セットやテストセットを用いた場合には、それらのセットにおけるプロットも表示されます。

説明変数と残差のプロット

（「分布」に［二項］・［多項］・［順序ロジスティック］・［Cox比例ハザード］を指定した場合は使用できません。また、尺度が［ベクトル］である説明変数が含まれている場合には使用できません。）モデル内の説明変数ごとに、残差を縦軸、説明変数の値を横軸にプロットします。モデル内の1つの説明変数に対して1つのプロットが作成されます。検証セットやテストセットを用いた場合には、それらのセットにおけるプロットも表示されます。

正規分位点プロット

（応答変数の確率分布として正規分布を指定し、かつ打ち切りがないデータの場合のみ使用可能。）縦軸に正規分位点、横軸に標準残差をプロットします。検証セットやテストセットを用いた場合には、それらのセットにおけるプロットも表示されます。

列の保存

あてはめたモデルに基づく、データ行ごとの統計量を含む列をデータテーブルに保存できます。［Cox比例ハザード］分布が選択されている場合に使用可能なオプションについてはCoxの比例ハザードモデルにおける保存オプションを参照してください。他の分布については、次の列をデータテーブルに保存できます。

関数予測式の保存

（応答変数の列に［FDE FPC 番号］列プロパティが含まれている場合にのみ使用できます。）応答変数として指定された関数主成分スコアの各列に対して、その予測式をデータテーブルに保存します。また、モデル予測式もデータテーブルに保存します。このモデル予測式は、関数主成分スコアの予測式と、「関数データエクスプローラ」プラットフォームで計算された固有関数との1次結合で表されます。さらに、スクリプトがデータテーブルに追加されます。このスクリプトは、モデル予測式に基づいて、元の応答変数のプロファイルを描きます（それらの元の応答変数は、関数主成分スコアの列における「FDE出力」列プロパティにて指定されています）。関数主成分分析の詳細については、『予測モデルおよび発展的なモデル』の関数データエクスプローラを参照してください。

注: ［関数予測式の保存］オプションでは、レポートのすべての応答変数（関数主成分スコアの列）1つ1つに対して、予測式を求めます。1 つの応答変数に対して複数のモデルがあてはめられている場合、予測式としては、その応答変数に対して最後にあてはめたモデルの予測式が使われます。

予測式の保存

予測式を含む列を保存します。この予測式は、標準化されていない観測値に基づくものです。係数がゼロになっている項は予測式に含まれません。平均の計算式については、分布の統計的詳細を参照してください。

応答列がカテゴリカルのとき、このオプションは、各応答に対して予測確率の列と、最も予測確率の高い応答水準を示す列を作成します。「最も予測確率の高い応答水準」とは、モデルから計算される確率が最大となっている水準のことです。確率の閾値が0.5以外の値の場合、「最も予測確率の高い応答水準」は確率の閾値に基づいた分類と一致します。

平均の信頼区間

応答変数の平均に対する両側95%信頼区間を含む2つの列（下限と上限）を保存します。

注: 信頼水準（a）を変更するには、「モデルの指定」の赤い三角ボタンのメニューから［有意水準の設定］を選択します。

予測値の標準誤差

予測値の標準誤差を含む列を保存します。

残差計算式の保存

Yから予測値を引いた残差の計算式を含む列を保存します。ゼロの項は、残差の計算式には含まれません。「分布」に［二項］を選択した場合、このオプションは使用できません。

分散計算式の保存

分散の計算式を含む列を保存します。これは、選択した分布に基づき計算される、応答変数の分散の推定値です。分散に対するリンク関数の逆関数を線形成分に適用すれば、応答変数の分散になります。この式にそれぞれの推定値を代入することにより、応答変数の分散の推定値を算出できます。各分布における分散の式については、分布の統計的詳細を参照してください。「分布」に［二項］を選択した場合、このオプションは使用できません。

線形予測子の保存

計画行列とパラメータ推定値の積の計算式を含む列をデータテーブルに保存します。この式は通常、Xbと表されます。この式にはゼロの項は含まれません。

検証列の保存

（検証法に［K分割］・［保留］・［1つ取って置き法］を指定した場合にのみ使用可能。）各データ行がどのセットに割り当てられているかを示す列を保存します。［K分割］の場合、データは複数に分割されます。［保留］の場合、各行は学習セットと検証セットに分割されます。［1つ取って置き法］の場合、学習データから1行ずつ除外されていきます。

注: 起動ウィンドウで「検証」列を指定した場合、［検証列の保存］オプションは表示されません。

シミュレーション計算式の保存

あてはめたモデルのパラメータ推定値を使って値をシミュレーションする計算式を含む列を保存します。このオプションによって保存した列は、「シミュレーション」ユーティリティで切り替え先の列として使用できます。『基本的な統計分析』のシミュレーションを参照してください。

Cookの距離

（応答変数の確率分布として正規分布を指定し、かつ推定法が［標準最小2乗］である場合のみ使用可能。）列を「Cookの距離」の値を含むデータテーブルに保存します。

ハット

（応答変数の確率分布として正規分布を指定し、かつ推定法が［標準最小2乗］である場合のみ使用可能。）列をX(X‘X)-1X‘の対角要素をデータテーブルに保存します。この統計量は、ハット値と呼ばれることがあります。

予測式を発行

予測式を作成し、それらを「計算式デポ」プラットフォームの計算式列のスクリプトとして保存します。「計算式デポ」レポートが開かれていない状態の場合には、このオプションを選択すると、「計算式デポ」レポートが新たに作成されます。『予測モデルおよび発展的なモデル』の計算式デポを参照してください。

Coxの比例ハザードモデルにおける保存オプション

生存確率計算式の保存

観察された時間に対する生存確率の計算式を含む列を、データテーブルに保存します。

Cox-Snell残差計算式の保存

Cox-Snell残差の計算式を含む列を、データテーブルに保存します。Cox-Snell残差は常に正の値です。Cox-Snell残差の詳細は、Meeker and Escobar（1998, sec. 17.6.1）を参照してください。

Martingale残差計算式の保存

Martingale残差の計算式を含む列を、データテーブルに保存します。Martingale残差は、個々に対して観察されたイベント数と条件付きで予想されるイベント数との差として定義されます。Martingale残差の平均はゼロで、範囲はマイナス無限大と1の間です。Fleming and Harrington（1991）を参照してください。

線形予測子の保存

あてはめの削除

あてはめのレポートを削除します。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).