公開日: 04/21/2025

基底関数展開モデルのレポート

この節では、「関数データエクスプローラ」プラットフォームで基底関数展開モデルをあてはめたときに利用できるレポートについて説明します。

Image shown hereモデルの設定

「モデルの設定」レポートでは、あてはめるモデルを指定します。指定されたいくつかのモデルの結果は「モデル選択」レポートで比較することができます。「モデルの設定」レポートで指定できる設定は、あてはめるモデルの種類によって異なります。

メモ: 「モデルの設定」は、ウェーブレットモデルでは使用できません。

B-スプラインモデルおよびP-スプラインモデルの設定

B-スプラインモデルおよびP-スプラインモデルをあてはめるときには、次の設定を指定できます。

節点の個数

スプライン曲線で用いる節点の個数を、追加・削除できます。また、追加する節点の個数を範囲で指定することもできます。節点はゼロ以外の整数でなければなりません。

メモ: B-スプラインモデルで指定できる節点の最大個数は、1関数における観測値の最大数または1関数における一意な入力値の個数から1を引いた数です。P-スプラインモデルで指定できる節点の最大個数は、1関数における一意な入力値の個数よりも2少ない数です。これらの最大個数よりも大きな数を指定すると、警告メッセージが表示されます。

スプライン次数

チェックボックスにより、「モデル選択」レポートから該当のスプライン次数の結果を追加・削除できます。

Fourier基底モデルの設定

Fourier基底モデルに対しては、次の設定を指定することができます。

Fourier基底ペアの個数

Fourier基底モデルにおける、正弦と余弦のペアの個数を追加・削除できます。また、追加するペアの個数を範囲で指定することもできます。

周期

関数の周期を変更します。

モデルの設定を指定後、[実行]をクリックすると、「モデル選択」レポートのモデルが更新されます。

ヒント: モデルをあてはめる前に「モデルの設定」を指定するには、「関数データエクスプローラ」の赤い三角ボタンをクリックし、[モデル]>[モデルの設定]を選択します。その後、目的のモデルを選択します。

Image shown hereモデル選択

「モデル選択」レポートには、全体的な予測プロット、グリッド形式の個々の予測プロット、モデル選択規準統計量のプロット、および表が表示されます。個々の予測プロットのグリッドは「データ処理」レポートにある個々のプロットのグリッドと同じレイアウトであり、矢印のボタンなど同様のコントロールがあります。一度に表示できるプロットの最大数は20個です。ドロップダウンメニューと矢印を使って、表示する個々の予測プロットのグループを変更できます。

予測プロットでは、データ値が点としてプロットされ、また予測値の曲線が描かれています。検証セットがある場合、検証セット内の関数の予測曲線は表示されません。全体の予測プロットに描かれている曲線は、複数の関数の予測値を平均したものです。個々の予測プロットに描かれている曲線は、各々の関数の予測値です。B-スプラインモデルに対する全体の予測プロットには、節点の位置も表示されます。この全体の予測プロットにおける垂直の青線をドラッグして移動することにより、節点の位置を変更できます。節点を新しい位置に移動したモデルのレポートに更新するには、[モデルの更新]ボタンをクリックします。節点をデフォルトの位置に戻すには、[節点のリセット]ボタンをクリックします。

ウェーブレットモデルの場合は、[係数]タブもあります。ウェーブレットモデルにおける[係数]タブには、全体的な係数プロットと個々の係数プロットのグリッドが含まれています。この係数プロットでは、各解像度における係数の相対的な重要性が破線で描かれています。プロットされる破線は、入力変数の値(横軸)と解像度(縦軸)によって決まります。これらの数値は、「ウェーブレット係数」表の列名にあります。個々のプロット上の各線の色は、対応する係数の符号によって決まります。青は正の係数、赤は負の係数を示します。プロットの各破線の長さは、係数によって決まります。各破線の長さは、係数の最大値の絶対値によって尺度化された、係数の値になっています。したがって、最大となっている係数の破線が最も長く、係数が小さくなるにつれて線が短くなります。平均プロットの場合、係数は各関数で平均化されます。各破線の色と長さは、平均化および尺度化された係数によって決まります。

メモ: 係数プロットは、適合度が最良であるウェーブレットモデルに対してのみ表示されます。

モデル選択規準統計量のプロットと関連する表の外観は、モデルのタイプによって異なります。

B-スプラインモデルとP-スプラインモデル

これらのモデルの選択規準統計量のプロットでは、定義された数の節点に対して規準統計量がプロットされます。そして、スプライン次数ごとに、折れ線が描かれます。このプロットでは、デフォルトでBIC(ベイズ情報量規準; Bayesian Information Criterion)がプロットされます。モデルの赤い三角ボタンのメニューにある[モデル選択]を使用して、規準統計量を変更できます。現在選択されているモデルは、モデル選択規準統計量のプロットにおいて垂直の点線で示されています。デフォルトで選択されているスプラインの次数と節点の数は、モデル選択規準統計量が最小となっているモデルのものです。選択されているモデルを変更するには、垂直線の上部にあるスライダをドラッグするか、モデル選択規準統計量のプロットまたは凡例内で特定のスプラインをクリックします。これらの操作により、「モデル選択」レポートのプロットや情報が自動的に更新されます。

モデル選択規準統計量のプロットの下には、現在のモデルに関する情報を含む、「適合度統計量」表があります。ここには、節点数・スプライン次数・(-2)*対数尤度・AICc・BIC・GCV、および応答の標準偏差が表示されます。この「応答の標準偏差」は、現在のモデルにおける誤差の標準偏差(の推定値)です。P-スプラインモデルにおいては、ペナルティパラメータl(罰則パラメータであるラムダ)も表示されます。

Fourierモデル

Fourierモデルに対する選択規準統計量のプロットでは、Fourier基底ペアの個数に対してモデル選択規準統計量がプロットされます。このプロットでは、デフォルトでBIC(ベイズ情報量規準; Bayesian Information Criterion)がプロットされます。モデルの赤い三角ボタンのメニューにある[モデル選択]を使用して、規準統計量を変更できます。現在、選択されているモデルは、モデル選択規準統計量のプロットにおいて垂直の点線で示されています。デフォルトで選択されているモデルは、モデル選択規準統計量が最小となっているモデルです。垂直の点線をドラッグして移動すると、現在のモデルを変更できます。垂直の点線をドラッグして移動すると、「モデル選択」レポートのプロットや情報が自動的に更新されます。

モデル選択規準統計量のプロットの下には、現在のモデルに関する情報を含む、「適合度統計量」表があります。ここには、Fourier基底ペアの個数、(-2)*対数尤度・AICc・BIC・GCV、および応答の標準偏差の値が表示されます。この「応答の標準偏差」は、現在のモデルにおける誤差の標準偏差(の推定値)です。

ウェーブレットモデル

ウェーブレットモデルに対する選択規準統計量のプロットでは、モデル番号に対してモデル選択規準統計量がプロットされます。このプロットでは、デフォルトでBIC(ベイズ情報量規準; Bayesian Information Criterion)がプロットされます。モデルの赤い三角ボタンのメニューにある[モデル選択]を使用して、規準統計量を変更できます。現在、選択されているモデルは、モデル選択規準統計量のプロットにおいて垂直の点線で示されています。デフォルトで選択されているモデルは、モデル選択規準統計量が最小となっているモデルです。

モデル選択規準統計量のプロットの下の表には、モデル番号とモデル名、および現在のモデル選択が示されます。この表はモデル選択規準統計量の順に並べられており、適合度が最良であるモデルが一番上に表示されています。縦の点線の上部にあるスライダをドラッグするか、表でモデルを直接選択することで、モデルを選択できます。異なるモデルを選択すると、「モデル選択」レポートのプロットや情報が自動的に更新されます。

Image shown here診断プロット

「診断プロット」としては、「予測値と実測値のプロット」と「予測値と残差のプロット」が表示されます。これらのプロットは、現在のモデルがデータにどの程度あてはまっているかを評価するのに役立ちます。「診断プロット」レポートは、デフォルトでは閉じています。

Image shown here関数の要約

関数主成分分析に関する統計量がID変数の水準ごとに表示されます。データ変動の1%以上を説明する主成分だけが、デフォルトで表示されます。平均・標準偏差・中央値(メディアン)・最小値・最大値・平均差・積分2乗誤差平方根(RISE; Root Integrated Square Error)・積分2乗関数平方根(RIFS; Root Integrated Function Square)も表示されます。平均差と積分2乗誤差平方根(RISE)の要約値は、ID特有の関数が全体的な平均値関数とどのくらい異なるかを判断するのに使用されます。積分2乗誤差平方根(RISE)は、IDごとの関数がどれぐらいばらついているかを表しています。「関数の要約」レポートの統計的詳細を参照してください。

メモ: 積分差、積分2乗誤差平方根(RISE)、および積分2乗関数平方根(RIFS)は、ウェーブレットモデルでは使用できません。

Image shown here係数

推定された基底関数係数とその標準偏差の表が表示されます。これらの係数はすべての水準のID変数にわたって共通であり、混合モデルの枠組みにおける固定効果に対する推定値です。係数の信頼区間と標準誤差を表示するには、テーブル内で右クリックし、[列]を選択します。

ウェーブレットモデルの場合は、推定されたウェーブレット係数がID変数の水準ごとに表示されます。ファザーウェーブレットの列と、残りの係数に関する一連の列があります。各係数列は、それぞれ対応する解像度と、入力変数の位置によって識別されます。係数表には、閾値処理(thresholding)によって求められたウェーブレット係数の疎の表現が含まれています(Donoho, 1995)。

Image shown hereランダム係数

各関数に対して、基底関数のランダム係数が表示されます。ランダム係数の推定値は、ID変数の水準ごとに計算され、混合モデルの枠組みにおける変量効果に対する推定値です。

メモ: 「ランダム係数」レポートは、ウェーブレットモデルでは使用できません。

Image shown here関数主成分分析

「関数主成分分析」レポートには、推定されたモデルに対する関数主成分分析の結果が表示されます。「関数主成分分析」レポートには、関数主成分(FPC; Functional Principal Component)の固有値が大きい方から順に記載されています。また、各FPCが説明する変動のパーセントおよび累積パーセントが、棒グラフと一緒に表示されます。平均関数のグラフと、各形状関数のグラフがあります。これらは固有関数の値です。

「関数主成分分析」レポートでモデル選択を行うと、特定の次元に対する関数主成分の結果を精査できます。関数主成分の次元数に対して、Bayes情報量規準(BIC)をプロットしたグラフが表示されます。このプロットには、関数主成分における現在の次元数が縦の点線で示されています。関数主成分の次元数が異なるモデルでも、情報量規準が同じぐらいになる可能性があります。そのため、モデル選択規準統計量のプロットにはゾーンが表示されます。これはBIC統計量に対する範囲を示すものです。緑のゾーンと黄色のゾーンがあります。緑色のゾーンは、「最小BIC」から「最小BICプラス4」までの範囲となっています。黄色のゾーンは、「最小BICプラス4」から「最小BICプラス10」までの範囲となっています。デフォルトでは、緑のゾーン内に位置しているもののなかで最小数の関数主成分を持つモデルが選択されます。関数主成分の次元数は、縦線をドラッグすることで変更できます。縦線をドラッグすると、「関数主成分分析」レポート内の他の情報も自動的に更新されます。

メモ: Y軸のスケール全体よりも狭いゾーンは、プロット上に表示するのが難しい場合があります。その場合は、Y軸をズームインすると、ゾーンが見やすくなります。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).