Mosaikdiagramm

Was ist ein Mosaikdiagramm?

Ein Mosaikdiagramm ist eine besondere Art des gestapelten Balkendiagramms, das Prozentsätze von Daten in Gruppen zeigt. Das Diagramm ist die grafische Darstellung einer Kontingenztabelle.

Wie werden Mosaikdiagramme verwendet?

Mosaikdiagramme werden verwendet, um Beziehungen zu veranschaulichen und einen visuellen Vergleich zwischen Gruppen zu ermöglichen.

Mosaikdiagramme zeigen Beziehungen

Ein Mosaikdiagramm ist eine Sonderform des gestapelten Balkendiagramms. Für zwei Variablen ist die Breite der Balken proportional zur Anzahl der Beobachtungen in jeder Stufe der Variable, die auf der horizontalen Achse eingezeichnet sind. Die vertikale Länge der Balken entspricht der Anzahl der Beobachtungen in der zweiten Variable für jede Stufe der ersten Variable.

Mosaikdiagramme helfen dabei, Zusammenhänge zu erkennen, und bieten eine visuelle Methode zum Gruppenvergleich. Abbildung 1 zeigt ein Mosaikdiagramm für Daten aus einer klinischen Studie. Das Ziel besteht darin, die Verteilung der Patienten über 65 Jahre in der Placebo- und in der Medikamentengruppe zu vergleichen. Idealerweise sollte in der klinischen Studie der Anteil der Senioren in jeder Gruppe gleich sein.

Abbildung 1: Mosaikdiagramm vergleicht die Verteilung von Senioren in zwei Behandlungsgruppen

Das Mosaikdiagramm in Abbildung 1 zeigt, dass in der Placebo-Gruppe ein höherer Prozentsatz älterer Patienten gegeben ist als in der Wirkstoffgruppe der Studie. Das Team hinter der Studie muss entscheiden, ob die Anteile „ähnlich genug“ sind, um das Ziel zu erreichen. Dieses Mosaikdiagramm zeigt auch, dass insgesamt ein niedrigerer Anteil älterer Menschen gegeben ist.

Beispiele für Mosaikdiagramme

Beispiel 1: Beschriftungen hinzufügen

Abbildung 2 erweitert das Basisbeispiel um Beschriftungen im Mosaikdiagramm.

Abbildung 2: Mosaikdiagramm vergleicht die Verteilung von Senioren in zwei Behandlungsgruppen, Beschriftung mit Prozentsätzen

Wir sehen nun, dass beim Prozentsatz der älteren Patienten eine Differenz von 10 % zwischen den Placebo- und Wirkstoffgruppen besteht. Mit einem Chi-Quadrat-Test auf Unabhängigkeit können wir prüfen, ob diese Differenz signifikant ist.

Es bietet sich an, Beschriftungen zu Mosaikdiagrammen hinzuzufügen, wenn nur wenige Zellen vorhanden sind. Sind viele Zellen gegeben, werden die kleinsten vielleicht nicht unbedingt beschriftet. Wenn Ihr Datensatz klein ist, können Sie statt Prozentangaben Häufigkeitsbeschriftungen verwenden, um hervorzuheben, dass Ihre Visualisierung auf beschränkten Informationen basiert.

Beispiel 2: Zwei Variablen für Kategorien

Mosaikdiagramme können auf mehr als zwei Variablen erweitert werden. Der Graph in Abbildung 3 zeigt die Überlebenswahrscheinlichkeit für Passagiere auf der Titanic in Prozent. Die Kategorien werden durch die Kombination aus Stufen für die Fahrkartenklasse und das Geschlecht des Passagiers gebildet.

Abbildung 3: Mosaikdiagramm vergleicht die Überlebensquote nach Passagierklasse und Geschlecht

Beispiel 3: Prozentsätze auf der x-Achse.

Mithilfe von Mosaikdiagrammen können Prozentsätze auf der x-Achse dargestellt werden. Abbildung 4 zeigt Daten für Schüler in städtischen und ländlichen Schulen. Die Schüler wurden zu ihrem vorrangigen Ziel befragt: gute Noten, gute sportliche Leistungen oder Beliebtheit.

Abbildung 4: Mosaikdiagramm vergleicht die Ziele von Schülern an verschiedenen Schulstandorten

Das Mosaikdiagramm zeigt, dass die Ziele von Schülern in Städten und ländlichen Gegenden einander stark ähneln, und dass die Prozentsätze sehr nahe aneinander liegen. Die Schüler in ländlichen Gegenden haben verschiedene Ziele und sind sehr ausgeglichen auf die drei Ziele verteilt. Sie können ein Mosaikdiagramm auch mit Häufigkeiten beschriften.

Beispiel: Sortierte Reihenfolgen verwenden

Manchmal zeigt das Mosaikdiagramm aufgrund der Kategorien eine natürliche Reihenfolge. Ein Beispiel dafür sind die Daten der Titanic-Überlebenden in Beispiel 2.

Wenn das Mosaikdiagramm keine natürliche Reihenfolge aufweist, sind visuelle Vergleiche damit nur schwer möglich. Der Graph in Abbildung 5 zeigt die Verteilung der Fertigungsstandorte innerhalb der Fahrzeugkategorien.

Abbildung 5: Mosaikdiagramm der Verteilung von Fertigungsstandorten in der Fahrzeugkategorie

Wir sehen, dass alle großen Kraftfahrzeuge in den USA hergestellt werden, doch der Vergleich der Prozentsätze von Kompakt- und Mittelklasse-Fahrzeugen, die in den USA gefertigt werden, gestaltet sich schwierig.

Wir können das Mosaikdiagramm optimieren, indem wir die Fahrzeugkategorien in ansteigender Reihenfolge sortieren – je nach Prozentsatz der in den USA hergestellten Fahrzeuge. Abbildung 6 zeigt das überarbeitete Mosaikdiagramm. Wir können die Gruppen in diesem Diagramm jetzt einfacher vergleichen.

Abbildung 6: Mosaikdiagramm der Verteilung von Fertigungsstandorten in der Fahrzeugkategorie, sortiert nach Prozentsatz der US-Hersteller

Jetzt sehen wir, dass in den USA mehr Kompaktwagen als Mittelklassewagen hergestellt werden. Das sortierte Diagramm zeigt außerdem klar, dass alle Großfahrzeuge in den USA hergestellt werden.