Tree Map

Was ist eine Tree Map?

Eine Tree Map stellt anhand von Rechtecken in verschiedenen Farben und Größen die hierarchische Struktur von Daten dar.

Wie werden Tree Maps verwendet?

Tree Maps helfen Ihnen dabei, die Hierarchien der Daten sowie die Zusammenhänge zwischen Variablen nachzuvollziehen.

Tree Maps zeigen hierarchische Daten

Eine Tree Map ist eine Anordnung von Rechtecken, welche die hierarchischen Strukturen von Daten darstellt. Tree Maps wurden ursprünglich erstellt, um die Strukturen und Größen von Dateien auf einer Computerfestplatte darzustellen. Tree Maps werden heutzutage in unterschiedlichen Situationen eingesetzt, sowohl für Daten mit als auch ohne Hierarchien. Eine Tree Map kann selbst auf kleinstem Raum eine große Menge an Daten darstellen.

Tree Maps werden fast immer mit dem Computer erstellt. Die Größe der Rechtecke wird anhand eines Algorithmus in den Software-Tools proportional zur Anzahl der Beobachtungen vom jeweiligen Rechteck festgelegt. Die meisten Tools bieten die Option, die Rechtecke farbig zu markieren und Beschriftungen hinzuzufügen. Manche Tools ermöglichen einen Drill-Down für Detailuntersuchungen, die besonders dann von Nutzen sind, wenn es innerhalb einer Tree Map kleine Rechtecke gibt, deren Beschriftungen kaum lesbar sind.

Die einfache Tree Map in Abbildung 1 stellt die Umsatzstruktur für kleine, mittelgroße und große Unternehmen dar. Die Größe der Rechtecke hängt von dem durchschnittlichen Umsatz eines Unternehmens (in US-Dollar) für diese Unternehmenskategorie ab. Der Umsatz pro Mitarbeiter ist anhand der Farben des Rechtecks erkennbar.

Abbildung 1: Tree Map zur Größe eines Unternehmens und den Umsätzen pro Mitarbeiter

Der Graph in Abbildung 1 zeigt das Grundkonzept einer Tree Map. In diesem Beispiel lässt sich anhand der Farben der Rechtecke feststellen, dass mittelgroße Unternehmen den höchsten Umsatz pro Mitarbeiter erzielen. Aufgrund der Größe der Rechtecke können Sie schlussfolgern, dass große Unternehmen die höchsten Durchschnittsumsätze verzeichnen. Mithilfe der Tree Maps können Sie jedoch auch weitaus komplexere Daten visuell darstellen. Variablen mit komplexen Hierarchien eignen sich besonders gut für die Darstellung in einer Tree Map.

Beispiele für Tree Maps

Beispiel 1: Tree Map mit Kategorien und Hierarchien

Die Tree Map in Abbildung 2 baut das einfache Beispiel weiter aus und zeigt zwei Unternehmenskategorien sowie die Umsatzstruktur für kleine, mittelgroße und große Unternehmen für jede der Kategorien. In der Tree Map wird der durchschnittliche Umsatz eines Unternehmens für die Kombination aus der Kategorie und Größe des Unternehmens in US-Dollar angegeben sowie durch die Größe des Rechtecks bestimmt. Der Umsatz pro Mitarbeiter ist anhand der Farben des Rechtecks in der Tree Map erkennbar.

Abbildung 2: Tree Map mit zwei Unternehmenskategorien

Dank der Tree Map in Abbildung 2 lässt sich sehen, dass kleine Pharmaunternehmen den höchsten Umsatz pro Mitarbeiter verzeichnen. Die Größe des Rechtecks gibt an, dass große Unternehmen in beiden Kategorien die höchsten Umsatzzahlen erreichen. Wir können außerdem feststellen, dass der Umsatz pro Mitarbeiter bei mittelgroßen Computerunternehmen negativ ausfällt. Die Tree Map kann keine Beschriftung für das kleinste Rechteck für die kleinen Pharmaunternehmen erstellen. Dies kann bei größeren Datensätzen, in denen es viele kleine Rechtecke gibt, häufiger vorkommen. In diesem Fall sind Tools hilfreich, die „Hover-Hilfe“ oder auch interaktive detaillierte Detailuntersuchungen ermöglichen.

Die ursprüngliche Annahme, dass große Unternehmen die höchsten Durchschnittsumsätze verzeichnen, gilt auch weiterhin. Anhand der Kategorievariable wird jedoch deutlich, dass die ursprüngliche Schlussfolgerung in Bezug auf mittelgroße Unternehmen nicht stimmt. Mittelgroße Unternehmen verzeichnen nicht den höchsten Umsatz pro Mitarbeiter.

Beispiel 2: Kategorien und Hierarchien für größere Variablensätze mit mehreren Ebenen

Tree Maps eignen sich besser für größere Variablensätze, bei denen es zahlreiche Ebenen gibt. Abbildung 3 zeigt ähnliche finanzielle Daten wie Abbildung 2, diesmal jedoch mit einer Variable für die unterschiedlichen Arten an Unternehmen und mit sechs Ebenen. Es wird außerdem eine Variable für die unterschiedlichen Größen der Unternehmen angezeigt.Dieses Beispiel zeigt mehr Unternehmenskategorien als die vorherigen Beispiele. Die Größen der Rechtecke sind auf die durchschnittlichen Umsätze in US-Dollar eingestellt. Die Farben der Rechtecke geben die Art des Unternehmens an. Die Rechtecke an sich sind je nach Größe des Unternehmens angeordnet.

Abbildung 3: Tree Map mit mehreren Variablen und Kategorien

Diese Tree Map zeigt, dass Ölkonzerne im Vergleich zu allen anderen Unternehmen ihrer Größenordnung auf der gleichen Hierarchieebene die höchsten Durchschnittsumsätze verzeichnen. Getränkehersteller sind die umsatzschwächsten Unternehmen in der Kategorie der großen Unternehmen, dies ist jedoch nicht der Fall in den Kategorien der mittelgroßen oder kleinen Unternehmen. Als umsatzschwächste kleine Unternehmen gelten die Seifenhersteller. Die mittelgroßen Unternehmen mit den niedrigsten Durchschnittsumsätzen sind die Raumfahrtunternehmen.

Beispiel 3: Tree Map ohne eine Hierarchie

Tree Maps können selbst ohne eine Hierarchie nützliche Informationen bereitstellen. Die Tree Map in Abbildung 4 gibt die Gesamtschlafdauer von verschiedenen Tierarten in Stunden an. Die Lebensdauer einer Art ist durch die Größe des Rechtecks bestimmt und die Gesamtschlafdauer in Stunden ist durch die Farbe des Rechtecks erkennbar.

Abbildung 4: Tree Map zu Daten ohne Hierarchien

Die Farben in der Tree Map in Abbildung 4 geben an, dass Fledermäuse insgesamt am längsten schlafen. Anhand der Größe des Rechtecks lässt sich erkennen, dass die kleine braune Fledermaus eine längere Lebensdauer hat als die große braune Fledermaus. Die Größe der Rechtecke gibt außerdem an, dass Menschen (in diesem Fall ein Mann) die längste Lebensdauer aller Beispiele in der gesamten Tree Map haben.

Beispiel 4: Kategorie auf der Y-Achse

In den bisherigen Beispielen waren die Kategorien oder Hierarchien stets auf der X-Achse. Das Beispiel in Abbildung 5 stellt ein Diagramm dar, bei dem die Kategoriehierarchie auf der Y-Achse ist. Die Daten stammen von Autos, die Mitte der 1990er-Jahre hergestellt wurden. Die Größe der Rechtecke in der Tree Map hängen von dem Kraftstoffverbrauch (in Miles pro Gallone, MPG) der verschiedenen Automodelle ab. Die Kategorievariable der Y-Achse gibt an, ob ein Auto in den USA hergestellt wurde.

Abbildung 5: Tree Map mit Kategorien auf der Y-Achse

Die Tree Map lässt sich besonders gut für das Erkennen von allgemeinen Mustern nutzen. Sind die orangefarbenen Rechtecke bspw. in der Regel größer als die blauen Rechtecke? Das Geo Metro ist das Auto, das am wenigsten Kraftstoff verbraucht. Die Hover-Hilfe hilft Ihnen, diese Informationen herauszufiltern, da Sie auf diese Weise den Kraftstoffverbrauch (angegeben in MPG, Meilen pro Gallone) für jedes Rechteck einsehen können. Die Software hat automatisch alle Autos alphabetisch sortiert.

Beispiel 5: zwei Kategorien

Tree Maps werden besonders bei Datensätzen mit mehreren Kategorien eingesetzt, in denen die Kategorien die Struktur bestimmen. Die Tree Map in Abbildung 6 zeigt die Verspätungen für sechs verschiedene Fluggesellschaften sowie die Wochentage als Kategorievariablen an. Die Größen und Farben der Rechtecke hängen von der durchschnittlichen Ankunftsverspätung ab.

Abbildung 6: Tree Map mit mehreren Kategorien

Die durchschnittlichen Ankunftsverspätungen aller Fluggesellschaften variieren von Tag zu Tag. Wenn Sie die Fluggesellschaft mit den geringsten Verzögerungen auswählen möchten, sollten Sie sich laut der Tree Map entweder für Southwest oder Delta entscheiden. Die Flüge von Southwest und Delta verzeichnen am Anfang der Woche im Durchschnitt bis zu acht Minuten Verspätung, wobei es an Donnerstagen und Freitagen im Durchschnitt zu größeren Verspätungen kommt.Die höchste durchschnittliche Verzögerung liegt bei beiden Fluggesellschaften bei unter 11 Minuten. Im Gegensatz dazu ist 11 Minuten Verspätung die niedrigste durchschnittliche Verspätung für American. Die niedrigsten durchschnittlichen Verspätungen in der gesamten Tree Map werden von der Fluggesellschaft Southwest an Dienstagen verzeichnet. American verzeichnet dafür die höchsten durchschnittlichen Verspätungen an Freitagen.