基本的な回帰モデル > 一般化回帰の例 > ゼロ強調Poisson回帰の例
公開日: 04/01/2021

ゼロ強調Poisson回帰の例

「Fishing.jmp」サンプルデータは、公園を訪れたグループが釣った魚の数の架空データです。データは、家族連れやグループから収集した250行のデータです。この例では、「釣った魚」の数を、「生き餌」「釣竿の本数」「キャンプをした?」「人数」「子供」で予測します。これらの変数については、データテーブルの各列の「ノート」列プロパティに説明があります。「ノート」列プロパティを表示するには、列名を右クリックし、[列情報]を選択して、[列プロパティ]のリストで[ノート]を選択します。

このサンプルデータには、「釣りをした?」という非表示の列もあります。ただし、データの収集時には、グループ内の誰かが実際に釣りをしたかどうかは特定されておらず、この列の情報は観測されていません。データの魚がゼロ匹である場合は、グループの誰も釣りをしなかったケースと、釣りをした人がいるが1匹も釣れなかったケースの2通りが考えられます。「釣りをした?」列には、どちらのケースに該当するかが含まれています。

応答が0であるのには、前述した2つの原因が考えられます。このような場合には、ゼロ強調分布が適しています。釣りをしたグループでの釣った魚の数にはPoisson分布が適しているため、ゼロ強調Poisson分布をあてはめます。

1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Fishing.jmp」を開きます。

2. [分析]>[モデルのあてはめ]を選択します。

3. 「列の選択」リストで「釣った魚」を選択し、[Y]をクリックします。

4. 「生き餌」から「子供」までを選択し、[マクロ]>[設定された次数まで]をクリックします。

2次までの項(「次数」ボックスでのデフォルト)がモデルに追加されます。

5. 「列の選択」リストで「検証」を選択し、[検証]をクリックします。

6. 「手法」のリストから[一般化回帰]を選択します。

7. 「分布」リストから[ゼロ強調 Poisson]を選択します。

8. [実行]をクリックします。

「一般化回帰」レポートが開き、「モデルの比較」レポート、「モデルの設定」パネル、「最尤法 (検証法: 検証列, 分布: ゼロ強調 Poisson)」レポートが表示されます。デフォルトの「推定法」がLassoになっています。

9. 「推定法」リストから[弾性ネット]を選択します。

10. [実行]をクリックします。

「弾性ネット (検証法: 検証列, 分布: ゼロ強調 Poisson)」レポートが表示されます。「パラメータ推定値の経路」、「元の説明変数に対する推定値」レポート、「効果の検定」レポートを見ると、1つの項に対する推定値ゼロであることがわかります。また、両パラメータ推定値レポートの最終行に表示されている「ゼロ強調」パラメータは高度に有意です。つまり、「釣った魚」という応答の変動の一部は、釣りをしなかったグループがあることに起因しているようです。

図7.6 「元の説明変数に対する推定値」レポート 

Image shown here

「効果の検定」レポートからは、「生き餌」「釣竿の本数」「釣竿の本数*キャンプをした?」「釣竿の本数*子供」の4つの項が、有意水準5%において有意であることがわかります。

11. 「弾性ネット (検証法: 検証列, 分布: ゼロ強調 Poisson)」の赤い三角ボタンをクリックし、[プロファイル] >[プロファイル]を選択します。

12. 「予測プロファイル」の赤い三角ボタンをクリックし、[最適化と満足度]>[満足度関数]を選択します。

「釣った魚」の数の最大化を目標とする満足度関数が、応答に適用されます。満足度関数については、『プロファイル機能』の満足度プロファイルと最適化を参照してください。

13. 「予測プロファイル」の赤い三角ボタンをクリックし、[最適化と満足度]>[満足度の最大化]を選択します。

図7.7 釣った魚の数を最大にしたときの予測プロファイル 

Image shown here

設定を変えながら、有意な要因である「生き餌」「釣竿の本数」「釣竿の本数*キャンプをした?」「釣竿の本数*子供」の影響を確認できます。たとえば、「生き餌」を使うと、より多くの魚が釣れています。そして、「キャンプをした」方が、また持参した釣竿が多い方がより多くの魚を釣っています。

14. 「弾性ネット (検証法: 検証列, 分布: ゼロ強調 Poisson)」レポートの赤い三角ボタンをクリックし、[列の保存]>[予測式の保存][列の保存]>[分散計算式の保存]を選択します。

データテーブルに、「釣った魚 予測式」「分散 釣った魚」という2列が追加されます。

15. 計算式を確認するには、データテーブルでどちらかの列の見出しを右クリックし、[計算式]を選択します。または、「列」パネルの列名の右側にある+記号をクリックします。これらの2つの計算式には、ゼロ強調パラメータの推定値0.781522155が使用されています。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).