JMPテクニカルニュース:2014年8月28日号
≪コラム その1≫ アイスクリームの消費金額が最も高い都道府県は?
ああ、今日も暑い、暑い!
そんなときは、やはりアイスクリームで体を冷やすに限りますね!
ところで、世帯あたりでアイスクリームの消費金額が高い都道府県はどこか、 つまりアイスクリームの購入に一番お金を使っているのはどの都道府県なのかご存知ですか?
「暖かい」「暑い」イメージから沖縄県が連想されますが、実は沖縄県は最下位なのです。
根拠となっているデータは、総務省が行っている家計調査です(http://www.stat.go.jp/data/kakei/)。
二人以上の世帯を対象に、年ごとの一世帯あたりのさまざまなモノ(食料品やサービスなど)の購入頻度や消費金額などが、都道府県の県庁所在地別にデータ化されています。
そこで、最近3年間(2011年〜2013年)において、家計調査の項目である「アイスクリーム・シャーベット」の年間消費金額を調べてみました。
各都道府県の都市についての折れ線グラフは、次のとおりです。
※ | 家計調査の年次データは、下記の「家計調査年報(総世帯・二人以上の世帯・単身世帯)」から取得できます。 http://www.stat.go.jp/data/kakei/npsf.htm (各年次の年報 → 「詳細結果表へ」の「二人以上の世帯」→ <品目分類>の「都道府県庁所在市別」) |
グラフの縦軸は「アイスクリーム・シャーベット」の年間消費金額(円)です。
このグラフでは、どの折れ線がどこの都市かといった凡例は表示していません。
一番上側にあるだいだい色の折れ線をみると、2011年、2012年と2位に大きな差をつけて1位になっていますが、2013年にある都市に抜かれています。
ただし、この期間の年平均をとれば、この都市が1位になります。
また、先に述べたとおり、一番下側にある折れ線が沖縄県の那覇市になります。
では次に、年平均値を地図上に表してみます。
注:家計調査では代表的な都市の消費金額を示していますが、ここでは県庁所在地が属する都道府県で地図を描いています。
色が濃いほど、消費金額が高いことを示しています。最も濃い都道府県は、日本海側にあるあの県、そう石川県(金沢市)です。
平均金額を棒グラフであらわすと、次のようになります。
日本海側のお互いに隣接している県である石川県(金沢市)、富山県(富山市)が1位と2位を占めています。
2013年に石川県を追い抜いたのは富山県です。
冬が寒い北陸地方にある2つの県が1位・2位になるのは意外と感じる方も多いのではないでしょうか。
明確な要因はわかりませんが、現在では夏は冷房、冬は暖房で室温を調整するため、 年間で考えた場合にアイスクリームやシャーベットの消費金額と気温(外気温)の関係があまり密接でないのかもしれません。
■「アイスクリーム・シャーベット」の消費金額と相関がある食べ物は?
「アイスクリーム・シャーベット」は、家計調査の分類上は菓子類に属します。
ではこれらの消費金額が高い石川県や富山県は、他の菓子類や乳製品、さらに果物の消費金額も高いのでしょうか。
とりあえず、関係ありそうかなさそうかはあまり考えず、いろいろな品目について調べてみましょう。
JMPでは「列スイッチャー」を用いると、項目(列)を変えながら、それぞれのグラフを考察できて便利です。
以下のグラフは、「オレンジ」の年平均消費金額です。
オレンジの年間平均消費金額については、富山県(富山市)が1位、石川県(金沢市)が8位です(注:家計調査において、「オレンジ」と「みかん」は別項目)。
以下のグラフは、「チョコレート」の年平均消費金額です。
チョコレートの年間平均消費金額については、石川県(金沢市)が1位、富山県(富山市)が5位です。
ここではグラフを示しませんが、菓子類全体のの消費金額では、石川県(金沢市)が1位、富山県(富山市)が13位です。
果物全体の消費金額は、富山県(富山市)が7位、石川県(金沢市)が17位です。
卵や牛乳などの乳卵類については、両県は上位に入っていません。
石川県(金沢市)は菓子類の消費金額が高く、中でも特にアイスクリーム、シャーベット、チョコレートの金額が高くなっています。
富山県(富山市)は果物の消費金額が高く、特にオレンジの金額が高くなっています。
ただ、果物については、その都道府県で生産されている果物の出荷量にも影響されているのかもしれません。
では、「アイスクリーム・シャーベット」の消費金額と相関が高い項目とは、どのようなものでしょうか?
都市ごとに要約して、各項目の年平均消費金額を算出し、JMPの[多変量の相関]を用いて調べてみましょう。
今回のデータでは、項目が多いため「相関」のレポートをデータテーブルに出力し、 「アイスクリーム・シャーベット」との相関係数の高い順に並べ替えてみました。 以下に、相関係数が0.2より大きいものを示します。
やはり「アイスクリーム・シャーベット」との相関が高いのは、チョコレート、プリン、ケーキなど甘い洋菓子のようです。
ただ、せんべいとの相関係数が0.446と高くなっているのも気になるところです。
ご参考までに、「チョコレート」から「せんべい」までの「アイスクリーム・シャーベット」との散布図と95%確率楕円を示します。
石川県(金沢市)と沖縄県(那覇市)は、いずれの散布図においても確率楕円から外れていることがわかります。
■消費金額に相関がある食べ物は?
では、「アイスクリーム・シャーベット」に限らず、どのような項目どうしの相関が高いか見てみましょう。
[多変量の相関]のレポートでは、「散布図行列」を表示させることができますが、
今回のように項目が多い(33項目)場合は、行列は非常に大きくなり、一度にすべてを見渡すことができません。
そのようなとき、「多変量」のレポートから相関のカラーマップを表示させる方法が考えられます。 レポート左上の赤い三角ボタン(▼)から、[カラーマップ ] → [相関のカラーマップ]を選択します。
相関の大きさを色の濃淡で表したマップです。相関係数が-1〜1に対し、青色〜赤色で表しています。
気になるセルにマウスを近づけると、相関係数の値をホバーヘルプとして表示させることもできます。
さらにJMPでは、[相関のクラスタリング]という機能で、似た相関を持つ変数をまとめることができます。 レポート左上の赤い三角ボタン(▼)から、[カラーマップ]→[相関のクラスタリング]を選択します。
カラーマップの左上側に赤色のセル(正の相関が高い)が集まっていることがわかります。
これらの項目間が比較的高い相関係数をもつことがわかります。
「アイスクリーム・シャーベット」、「ケーキ」、「ようかん」、「ゼリー」、「なし」……。
ほとんどの食べ物が筆者の好物です!とはいっても、あまりお金をかけられないのですが。
最後に主成分分析を実行しましょう。
主成分分析は、多くの変数の変動をできるだけ説明するような軸を求め、
できるだけ少ない次元で変数間の関連性をみる手法です。
JMPの[主成分分析]プラットフォームでは、主成分分析を行い、(主成分の)負荷量のプロット、
スコアのプロットを表示できます。
負荷量のプロットでは、相関の強い変数同士が近くにプロットされるため、変数間の関連を視覚的に確認できます。 スコアのプロットは、各サンプル(この例では都市)のスコアを成分ごとに求めることができ、そのスコアをプロットしたものです。
さらに、JMPでは負荷量と主成分のスコアを重ね合わせたバイプロットを描くことができます。 バイプロットにより、サンプル(都市)と変数(消費金額の項目)間の関連性をみることができます。
下の図が主成分1と主成分2のバイプロットです。この2つの成分で、約36%を説明しています。
赤い矢印の先がそれぞれの項目の負荷量を示し、プロットが各都市のスコアを示します。
ここでは、本記事で話題にしている石川県(金沢市)、富山県(富山市)、沖縄県(那覇市)にラベルをつけています。
負荷量のプロットをみると、右上にアイスクリーム・シャーベットやチョコレート、ビスケットが近くに位置しています。
一方、成分2軸(縦軸)ではこれらと対立的な項目になりますが、右下にイチゴ、グレープフルーツ、キウイフルーツ、
いちごなどの果物類が位置しています。
2軸は果物類と菓子類を識別する軸なのかもしれません。
スコアプロットでは石川県(金沢市)や富山県(富山市)に対し、 沖縄県(那覇市)が成分1軸(横軸)に対し対立的な方向に位置しています。
主成分分析では第3成分まで結果を考察したり、主成分を回転したり……といろいろな分析ができますが、 今回はここまでにしておきます。
今回の調査では、消費金額そのものの値を使って分析を行いましたが、 金額であるが故に、ある項目の消費金額が高くなれば、節約を考え他の消費金額が低くなるのかもしれません。
また、都道府県別にみると、家計における所得額も異なるため、たとえばある都市の可処分所得に対する各項目の消費金額の割合を評価項目にする、 といった分析も考えられそうです。
少し熱くなってこの原稿を書いていたら、アイスクリームが食べたくなってきました。
やっぱり夏はアイスクリームですね。
≪コラム その2≫ あの格言「ゲームは1日1時間」の正当性が実証される
先日、何気なくWebのニュースを見ていたら、「『ゲームは1日1時間』は正しかった」という記事を発見し、 眠かった頭が急に覚醒しました。
オックスフォード大学の研究結果によると、1日のゲーム時間が1時間以内である子どもとゲームをしない子どもを比較すると、
前者の方が生活満足度は高く、社交性も高くなるようです。
一方、3時間以上ゲームをする子どもの場合は、落ち着きがなくなり、注意力が散漫になるようです。
冒頭の格言は、30年ほど前に、知る人ぞ知る某ゲーム名人が唱えたものです。
読者の方の中には、子どものときにこの格言を聞いた方もいらっしゃるのではないでしょうか。
また、現在は親御さんとして、お子さんにゲームのやり過ぎを注意するときにこの格言を使っている方もいらっしゃるかと思います。
当然ながら、当時、某名人は科学的な根拠をもとに1日1時間といったわけではありません。
しかし、30年の時が経ち、この格言の正当性が科学的に実証されたことになります。
この根拠を示した論文(英語)は無料で閲覧できるので、どんな内容なのか確認してみました。
調査対象は、イギリス全土の10歳から15歳の子ども約5,000人です。
対象者を、家庭用ゲーム機(console-based games)の利用時間とパソコンなどのコンピュータで行うゲーム(computer-based games)の
1日あたりの利用時間で次の4段階に分類しています。
- none(ゲームをしない)
- <1 (1時間以内)
- 1 to 3 (1〜3時間)
- >3 (3時間以上)
さらに、SDQと呼ばれるアンケート調査票を送って回答を得ている模様です。
SDQとは子どもの行動を評価する調査票であり、日本の厚生労働省によれば、
子どもの困難さ(difficulty)だけでなく、強み(strength)も評価できる点が他の調査票とは異なり、
攻撃的行為/多動/情緒/仲間関係/社会性の5分野計25項目の質問項目から構成されるとの記載があります。
これらの質問項目に答えることによって、個人の生活満足度(Life Satisfaction)や社交性※(Prosocial Behavior)などがスコア化され評価できるようです。 そのため、上記のゲーム時間ごとに、これらのスコアを比較しています。
※ 向社会的行動という訳がありますがここではわかりやすさを重視し社交性と訳しています
論文中には、どのような項目を用いて生活満足度や社交性のスコアを作成しているかが記載されていますが、詳細は割愛します。
対象者に対する社交性スコアの平均値は7.63、標準偏差が1.87であり、人生の満足度の平均は5.94、標準偏差は0.86となっています。
これらのスコアは、高いほど良好であることを示します。
なお、この論文での分析は、調査対象に重みをつけるなどの調整を行っているようですが、ここでは調整については考えないことにします。
分析の方法として、ゲーム時間のカテゴリを3つの対比コード化された回帰分析の回帰係数で評価したとの記載があります。
論文に記載されている結果表では、ゲーム機の種類別(家庭用ゲーム機/パソコン等)に、 生活の満足度や社交性などのスコアを、以下の3つの組み合わせで比較しています。
- <1 vs none (1時間以内のグループ vsゲームをしないグループ)
- 1 to 3 vs none (1〜3時間のグループ vs ゲームをしないグループ)
- >3 vs none(3時間以上のグループ vs ゲームをしないグループ)
たとえば、家庭用ゲーム機について生活満足度の比較をしたところでは、「<1 vs none」について、 B(標準化していない回帰係数)の値は0.10、SE(係数の標準誤差)0.021、 95%CI(係数の95%信頼区間)0.06〜0.14、P(p値) <.001 となっています。
論文の内容から、次のような分析を行っていると考えられます。
疑似的に作成したものですが、次のような1000件(1000人分)のデータがあったとします。
データテーブルの列「playtime」はゲームのプレイ時間(4カテゴリ)、
列j「score」はその人のある評価項目(生活の満足度など)に対するスコアです。
このデータに対し、コード化した変数「X(<1)」、「X(1 to 3)」、「X(>3)」を次のルールで作成します。
X (<1) | X (1 to 3) | X (>3) | |
---|---|---|---|
<1 | 1 | 0 | 0 |
1 to 3 | 0 | 1 | 0 |
>3 | 0 | 0 | 1 |
none | 0 | 0 | 0 |
たとえば、「X(<1)」という変数は、「Play Time」の値が「<1」であれば値1を、それ以外であれば値0を返します。 JMPの計算式で作成する場合は、If関数またはMatch関数を用いますが、ここではMatch関数を使用した例を示します。
同様に、「X(1 to 3)」、「X(>3)」を作成すると、次のようなデータテーブルが出力されます。
名義尺度の変数を、1または0の値をとる連続変数にコード化したことになります。
回帰分析では「score」を目的変数、3つのコード化した変数を説明変数とします。
JMPでは、[モデルのあてはめ]を用い、次のように列を指定します。
[実行]ボタンをクリックすると分析レポートが表示されます。
ここで、「パラメータ推定値」のレポートを参照します。
デフォルトでは推定値の95%信頼区間は表示されないので、レポートの数字の部分を右クリックし、
右クリックメニューから[列]→[下側95%]、[上側95%]を選択します。

項「X(<1)」の推定値は、「<1(1時間以内) 」を「none(ゲームをしない)」に対して 比較したときの回帰係数であり、0.194と正の値をとります。
係数が正であれば、「<1」が「none」に対してscoreが高いことが示されますが、
推定には誤差があるため、信頼区間やp値で判断することになります。
p値をみると0.0178であり、有意水準を0.05とすると統計的に有意です。
項「X(1 to 3)」の推定値は、「1 to 3(1〜3時間)」を「none(ゲームをしない)」に対して比較したときの回帰係数です。 係数は-0.054と負の値ですが、p値は0.5563となり統計的に有意ではありません。
項「X(>3)」の推定値は、「>3(3時間以上)」を「none(ゲームをしない)」に対して
比較した ときの回帰係数です。
係数は-0.301と負の値であり、p値は0.0063で統計的に有意です。
注1:JMPで出力されるp値は、「母推定値 = 0」という帰無仮説に対し、「母推定値≠0」を対立仮説とした両側検定に対してです。
注2:今回はコード化した変数を意図的に作成しましたが、JMPにおいて名義尺度の変数は分析の際に内部的にコード化されるので、
値の順序で「none」を最後の水準とすれば、モデルの効果として名義尺度「play time」を指定することで同様の分析を実行できます。
ただし、JMPでは、内部的なコード化として 1と-1を用います。
このような結果になったとして、もしscoreが生活の満足度を示したスコアであったのであれば、次のようなことがいえます。
- 「1時間以内のグループ」は「ゲームをしないグループ」に対して生活の満足度が高い。
- 「1〜3時間のグループ」と「ゲームをしないグループ」では生活の満足度について関連性がない。 すなわちどちらの満足度が高い、満足度が低いということは言えない。
- 「3時間以上のグループ」は「ゲームをしないグループ」に対して生活の満足度が低い。
論文の結果は、まさに上で示した疑似データと同様の結論が得られています(もちろん回帰係数やp値は異なりますが)。
生活の満足度(Life Satisfaction)について、家庭用ゲーム機(console game)を対象とした場合、「<1 vs none」の推定値は0.10、p値は <.001です。
「1 to 3 vs none」の推定値は0.01でp値は0.658、また「>3 vs none」の推定値は-0.17でp値は <.001 です。
上記は家庭用ゲーム機を対象とした場合ですが、パソコン等のゲーム(computer game)でもほぼ同様の結果になっています。
社交性についても同様の結果が得られますが、生活の満足度に比べて「<1 vs none」の推定値は大きくなり、 「>3 vs none」の推定値は小さくなっています。
他にもInternalizing problem(内面的な問題)、Externalizing problem(外面的な問題)についてもスコア化して比較を行っています。
これらの評価項目は、スコアが高ければ問題があることになります。
「<1 vs none」の場合は係数がマイナスになり有意、「1 to 3 vs none」場合は有意でない、 「>3 vs none」では係数がプラスになり有意という結果になっています。
論文では、このような分析を行った後のディスカッションとして、1日のゲーム時間が少ないグループの子どもにはゲームの恩恵(benefit)があり、 一方、ゲーム時間が多いグループの子どもには常にネガティブな結果が関連するかもしれないと記載されています。
この結果の驚くべきことは、ゲームをすることのネガティブな面だけ、あるいはポジティブな面だけではなく、
両方の面を扱っていることだと思います。
あくまで筆者の私的な感覚ですが、日本ではゲームをすることのネガティブな面が語られることはあっても、
ポジティブな面が語られることはないような気がしています。
子どもを対象にしたケースではありませんが、ゲームをすることのポジティブな面として、
たとえばテトリス(有名なパズルゲーム)をプレイすることでストレス障害(PTSD)のフラッシュバックが軽減されるなどといった、
良い面が学術的に報告されています。
特に今年の初めには、テトリスをプレイすると食欲などをおさえることができ、ダイエットにつながるといった報告もありました。
この調査での対象がイギリス人であること、また現在は携帯やタブレットなどゲーム機が多様化していることから、
必ずしも日本の子どもにあてはめることができるかどうかはわかりません。
ですが、研究が進めば、「お酒は適量が良い」と言われているのと同様に、「ゲームも短時間であれば良い」なんて言われる日が来るかもしれませんね。