モザイク図

モザイク図とは?

モザイク図は、グループ内のデータの割合を示す特殊なタイプの積み重ね棒グラフです。モザイク図は分割表をグラフ表示したものです。

モザイク図の使用方法

モザイク図は、関係を示し、グループ間の視覚的な比較を行うために使用されます。

関係を示すモザイク図

モザイク図は、特殊なタイプの積み重ね棒グラフです。2つの変数の場合、列の幅は、横軸にプロットされた変数の各水準の観測値の数に比例します。棒の縦方向の長さは、1つ目の変数の各水準における2番目の変数の観測値の数に比例します。

モザイク図は関係を示し、視覚的にグループを比較するのに役立ちます。図1は、臨床試験のデータのモザイク図を示しています。目標は、プラセボ群と治験薬群の両方で65歳以上の患者の分布を比較することです。理想的には、この臨床試験では、各治療群の高齢患者の割合がほぼ同じである必要があります。

図1:2つの治療群の高齢者の分布を比較したモザイク図

図1のモザイク図は、プラセボ群が治験薬群よりも高齢患者の割合が高いことを示しています。治験を実行しているチームは、割合が目標を達成できるほど「十分に近い」かどうかを判断する必要があります。このモザイク図は、全体的に高齢者の割合が低いことも示しています。

モザイク図の例

例1:ラベルの追加

図2は、モザイク図にラベルを追加することにより、基本的な例を拡張したものです。

図2:2つの治療群の高齢者の分布を比較した、割合のラベル付きのモザイク図

プラセボ群と治験薬群では、高齢患者の割合に約10%の違いがあることがわかります。独立性のカイ2乗検定を使用して、この差が有意であるかどうかを評価できます。

セルが少ない場合は、モザイク図にラベルを追加するのが理に適っています。セルが多すぎると、小さいセルがラベル付けされない場合があります。データセットが小さい場合は、割合ではなく度数ラベルを使用して、視覚化された図が限られた情報に基づいていることを強調できます。

例2:カテゴリの2つの変数

モザイク図は、3つ以上の変数に拡張できます。図3のグラフは、タイタニック号の乗客の生存率を示しています。カテゴリは、乗船券の等級と乗客の性別の水準の組み合わせによって定義されます。

図3:乗客の等級と性別ごとの生存率を比較したモザイク図

例3:x軸に割合を表示する場合

モザイク図では、x軸に割合を表示できます。図4は、都市部と地方の学校の生徒のデータを示しています。生徒たちは、良い成績を取ること、スポーツが得意であること、または人気があることのうち、どれが一番の目標かについて質問を受けました。

図4:さまざまな場所にある学校の生徒の目標を比較するモザイク図

モザイク図は、都市部と郊外の学生の目標が非常に類似しており、割合が非常に近いことを示しています。地方の学生は異なる目標を持っており、3つの目標にほぼ均等に分割されています。モザイク図に度数のラベルを付けることもできます。

例4:並べ替えられた順序の使用

カテゴリによって、モザイク図が自然な並べ替え順序で表示される場合があります。一例として、例2のタイタニック号の生存データを参照してください。

モザイク図が自然な順序でない場合、視覚的な比較に使用しづらい場合があります。図5のグラフは、車のカテゴリごとの製造場所の分布を示しています。

図5:車のカテゴリごとの製造地の分布を示したモザイク図

すべての大型車は米国で製造されていることがわかります。しかしながら、米国で製造されたコンパクトカーと中型車の割合を比較することは困難です。

米国で製造された車のカテゴリを割合の昇順で並べ替えることにより、モザイク図を改善できます。図6は、改良されたモザイク図を示しています。このプロットでは、グループをより簡単に比較できます。

図6:米国メーカーの割合で並び替えられた、車のカテゴリごとの製造地の分布を示したモザイク図

この図では、米国で中型車よりもコンパクトカーがより多く製造されていることがわかります。並び替えられた図は、すべての大型車が米国製であることも強調しています。