公開日: 04/01/2021

一般化線形モデル手法の概要

従来の線形モデルは、統計的データ分析で頻繁に使用されていますが、いつでも適しているわけではありません。従来の線形モデルの仮定が満たされない状況があるためです。従来の線形モデルは、応答が連続量であり、すべての観測値でデータの分散が一定だと仮定します。このような仮定は、場合によっては妥当ではありません。たとえば、度数にモデルをあてはめる場合や、応答の平均が大きくなるにつれてその分散も大きくなる場合などです。従来の線形モデルの仮定が満たされないもう一つの例は、0～1の間で動く割合など、応答の平均が特定の範囲に収まる場合です。

このような状況に該当する広範囲の問題に対して、一般化線形モデルが適しています。一般化線形モデルは、従来の線形モデルを拡張したものです。一般化線形モデルは、線形成分、リンク関数、分散関数で構成されます。リンク関数（g(mi) = x′ib）は、微分可能な単調関数で、Yiの期待値が説明変数の線形式にどのように関連しているかを示します。一般化線形モデルの一例は、log(mi)がリンク関数であるPoisson回帰モデルです。「モデルのあてはめ」プラットフォームの［一般化線形モデル］手法で使用できる一般化線形回帰モデルのモデル例を、一般化線形モデル手法の統計的詳細に示しています。

あてはめた一般化線形モデルは、従来の線形モデルと同じような統計量によって要約・評価できます。「モデルのあてはめ」プラットフォームでは、一般化線形モデルに対して、パラメータ推定値・標準誤差・適合度統計量・信頼区間・仮説検定を計算します。多くの一般化線形モデルでは、正確な分布を使った理論が存在しない、もしくは実用的ではありません。そこで、一般化線形モデルに対しては、通常、漸近的な方法で推測が行われます。

一般化線形モデルでも、説明変数の選択は重要です。該当する説明変数がどれだけモデルに貢献しているかは、通常、適合度統計量の変化量によって評価できます。デビアンス（deviance; 逸脱度）は、「データが到達可能な最大対数尤度」と「回帰パラメータの最尤推定値における対数尤度」の差に2を掛けたものです。デビアンスは、適合度の統計量としてよく使われます。「データが到達可能な最大対数尤度」は、すべての観測（オブザベーション）のそれぞれに1つのパラメータがあるモデルで達成されます。

Image shown here なお、変数選択や罰則を課した方法で一般化線形モデルをあてはめたい場合には、JMP Proの「モデルのあてはめ」プラットフォームにある［一般化回帰］手法を使用してください。一般化回帰モデルを参照してください。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).