JMPテクニカルニュース:2008年8月28日号
インデックス
≪JMP Tips≫ グラフを右クリックし、カスタマイズ
JMPで出力されたグラフは、グラフ上にマウスカーソルをもっていき、右クリック(Macintoshの場合は、Ctrlキーを押しながらクリック)して表示されるメニューからカスタマイズできます。
またはグラフ上の特定の点(マーカー)を選択して右クリックすれば、そのマーカーの色や形の変更、行ラベルの追加などができます。
右クリックメニューでは、グラフによってできることが多少異なりますが、注目する点の強調、大きさの調整、線幅の調整など、グラフの内容を変更できる機能ががたくさんあります。
今回は、この右クリックメニューの中で、便利な機能をいくつかご紹介します。
■ マーカーの透明度の指定(右クリックメニュー:[透明度...])■
透明度を指定することにより、データ点の濃淡で、度数の大小を判断できます(0(不透明)〜1(透明))。
データ点が重なりあうときに指定すると、そこにはどのぐらいの点が重なっているかを点の濃淡によって、他のデータ点と比較できます。
たとえば、アンケートの回答(商品の満足度など)を連続的なデータと見なして散布図で表した場合、値として、1,2,3,4,5などの離散値をとります。このようなとき、同じ値をとるデータが複数あれば、グラフ上の点は重なり合います。
■ グラフサイズの指定(右クリックメニュー:[サイズ/スケール])■
グラフの表示サイズを変更できます。サブメニューの[フレームサイズ]では、左右と上下(フレームの幅と高さ)のサイズを任意に指定できます。 またサブメニューの[アイソメトリックにする]は、グラフ上の距離を正確に反映した大きさに変更されます。
- ○ 適用例(アイソメトリックにする)
-
アイソメトリックとは、「同じ寸法」という意味です。
散布図で、x軸とy軸の測定単位が同じ場合に有効です。
アイソメトリックにすると、たとえば、x軸の値が10増加したときのグラフの距離と、y軸の値がが10増加したときのグラフの距離は等しくなります。 - ▼試してみましょう▼
-
JMPのサンプルデータ「Galton.jmp」を開きます。
次に、[分析] → [二変量の関係] で、次のように設定します。[Y,目的変数] : 「子供の身長」 [X,説明変数] : 「親の身長」 結果レポートの散布図上で右クリックし、[サイズ/スケール] → [アイソメトリックにする] を指定します。
■ グラフのカスタマイズ(右クリックメニュー:[カスタマイズ])■
JMP 7では、デフォルトのグラフ表示に対して、グラフの線色や線種、マーカーの形やサイズなどを変更できるようになりました。 このメニューを選択すると、新たにウィンドウが表示され、グラフに表示されているマーカーや線を個々にカスタマイズできます。
- ○適用例
-
生存分析で表示される生存曲線の色を変えたい、または、線を実線から点線に変更したいとき
- ▼試してみましょう▼
-
JMPのサンプルデータ「ラット.jmp」を開きます。
次に、スクリプト「生存時間分析」を実行します。結果レポートの最初に表示される生存分析プロットのグラフ上で右クリックし、[カスタマイズ]を指定します。
≪JMPで分析≫ オリンピックのデータを分析してみましょう
熱戦が繰り広げられた北京オリンピック。
皆様も日本人選手の活躍に胸を打たれたのではないでしょうか。陸上男子400mリレーでは、戦後初となるトラック競技でのメダルを獲得しました。
リレーほど注目はされませんが、陸上に「男子10種競技」「女子7種競技」という競技があります。
たとえば女子では、100m障害、走り幅跳びなど7つの種目に対し、ある決められた方法でスコア付けがされ、そのスコアの合計が高い順に順位が決まります。
特に日本人に強い選手がいるわけではないので、関心を持っている方は少ないかと思いますが、各選手に対して7種目の結果が出るため、データを分析するという意味では、興味深い競技です。
北京オリンピックでの、この競技の最終結果をデータにしてみました。
このデータをJMPを使って自由に分析してみてください。
データの概要:
- 次のWebページの結果を元に作成しました。
http://www2.asahi.com/olympic2008/result/AT/ATW700.html - 途中棄権者を除いたデータです。
- 800m の結果は、秒単位で表しています。
データを分析する際、「走高跳」「砲丸投げ」「走幅跳」「槍投げ」の結果は値が大きいほど良い結果ということになりますが、「100m障害」「200m」「800m」の結果は、値が小さいほど良い結果ということに注意してください。
グラフメニューの「パラレルプロット」では、指定した変数のスケールを逆転することができます。
- メニューから、[グラフ] → [パラレルプロット] を選択します。
- 「100m障害」〜「800m」をすべて [Y,応答変数] に指定して、パラレルプロットを表示させます。
- グラフ左上の赤い三角ボタン(▼)から[逆スケールの選択表示] を選択し、「100m障害」「200m」「800m」にチェックをいれます。
このグラフから、たとえば1位の選手(データ1行目)は他の選手に比べてどの種目の結果が良いか?または、最下位の選手(データ35行目)の得点が低かった要因は? などを考察することができます。
競技種目間の関連性を見るためには、例として次のような分析が考えられます。
[分析] → [多変量] → [多変量の相関] で、「100m障害」〜「800m」をすべて [Y,列] に指定して、散布図行列を表示させます。
パラレルプロットでも見てとれますが、最下位の選手のデータは、ある種目の結果の影響で、散布図上から外れた位置にあることがわかります。
zれは、左上の赤い三角ボタン(▼)をクリックして選択できるメニュー、[外れ値分析] → [Mahalanobisの距離] の結果からもわかります。
このデータは、除外して今後の解析をした方がよいのかもしれません。
グラフ上で該当のデータ点をクリックし、データテーブルに戻ると、該当のデータが選択状態になっています。この状態で、メニューから [行] → [除外する/除外しない] を選択し、一時的に分析から除外できます。
データを除外後、再度多変量の相関を行い、散布図行列を表示します。
JMP 6以降では、「散布図行列」の左にある赤い三角ボタンから、[相関の表示] を選択し、散布図の上側に相関係数を表示させることができます。
相関の高い種目のペアを見つけてみてください。
「100m障害」の結果を予測する変数をステップワイズ法で探してみます。[分析] → [モデルのあてはめ] で、次のようにモデルを指定します。
- 手法:「ステップワイズ法」(画面右上に表示)
[Y] : 「100m障害」 [モデル効果の構成] : 「走高跳」〜「800m」(合計6つの変数) - [モデルの実行] をクリック
- ステップワイズの回帰の設定はデフォルトのまま、[ステップ] ボタンで変数をモデルに追加していきます([実行] ボタンでは、自動的に変数選択を行うことができます)。
さて、結果のモデルにはどの種目が含まれているでしょうか。
他にも、主成分分析やクラスター分析を用いてデータを分類することも考えられます。
女子7種競技以外の結果も、ご自身でデータ化して分析してみてはいかがでしょうか。
次回のロンドン大会に向けた対策がひらめくかも?

