Mappa ad albero

Che cos'è una mappa ad albero?

Una mappa ad albero mostra la struttura gerarchica dei dati utilizzando rettangoli di dimensioni e colori diversi.

Come si usano le mappe ad albero?

Le mappe ad albero sono utili per visualizzare la gerarchia dei dati e le relazioni tra le variabili.

Le mappe ad albero mostrano dati gerarchici

Una mappa ad albero si presenta sotto forma di rettangoli che mostrano la struttura gerarchica dei dati. In origine, queste mappe venivano usate per mostrare la struttura e la dimensione dei file sul disco rigido di un computer. Oggi, invece, vengono applicate a un'ampia gamma di situazioni, incluse quelle che non prevedono una gerarchia, poiché consentono di mostrare un gran numero di dati in uno spazio ridotto.   

In genere, le mappe ad albero sono sempre generate al computer. Gli strumenti software usano un algoritmo per determinare una dimensione dei rettangoli proporzionale al numero di osservazioni incluse in ogni rettangolo. Molti di questi strumenti consentono anche di attribuire colori diversi ed etichette ai rettangoli. Alcuni includono addirittura degli approfondimenti che mostrano maggiori dettagli, caratteristica utile per le mappe ad albero con rettangoli così piccoli da rendere difficile vederne le etichette.

La semplice mappa ad albero in Figura 1 mostra la struttura delle vendite per piccole, medie e grandi aziende. Le dimensioni dei rettangoli dipendono dalle vendite medie (in dollari USA) per categoria aziendale, mentre i colori variano in base ai profitti per dipendente. 

Figura 1: Mappa ad albero con le dimensioni delle aziende e i profitti per dipendente

Il grafico in Figura 1 mostra il funzionamento base di una mappa ad albero. In questo esempio, dai colori dei rettangoli possiamo concludere che le aziende di dimensioni medie hanno un rapporto tra profitti e dipendenti maggiore. Inoltre, dalle dimensioni dei rettangoli notiamo che la media delle vendite più alta è quella delle aziende di grandi dimensioni. Tuttavia, le mappe ad albero possono essere impiegate per visualizzare anche dati più complessi. Le variabili con gerarchie complesse si prestano molto bene a essere mostrate tramite mappa ad albero. 

Esempi di mappa ad albero

Esempio n. 1: Mappa ad albero delle categorie e delle gerarchie

Espandendo l'esempio di base, la mappa ad albero in Figura 2 mostra due categorie aziendali e la struttura delle vendite per piccole, medie e grandi aziende in ciascuna categoria. Nella mappa, le dimensioni dei rettangoli dipendono dalla media delle vendite in dollari USA delle combinazioni di categoria e dimensione. I colori dei rettangoli variano in base ai profitti per dipendente. 

Figura 2: Mappa ad albero con due categorie di aziende

Dalla mappa ad albero in Figura 2, vediamo che il rapporto profitto/dipendente è più elevato nelle aziende farmaceutiche più piccole. Dalla dimensione dei rettangoli, è evidente che le grandi aziende di entrambe le categorie sono quelle che registrano le vendite più alte. Inoltre, si nota che le aziende informatiche di medie dimensioni hanno un rapporto profitto/dipendente negativo. La mappa ad albero non consente di etichettare i rettangoli più piccoli per le aziende farmaceutiche di minori dimensioni, ma si tratta di un problema piuttosto comune nei set di dati più grandi, che danno come risultato molti rettangoli piccoli. In questo caso, gli strumenti con “guida al passaggio del mouse” o approfondimenti interattivi possono essere molto utili. 

La conclusione iniziale, secondo cui le aziende più grandi hanno la media di vendite più elevata, è confermata. Al contrario, considerando la variabile delle categorie, la supposizione originale per cui le aziende di medie dimensioni avrebbero il migliore rapporto profitto/dipendente non è corretta.

Esempio 2: Categorie e gerarchie per set di variabili più ampi e su più livelli

Le mappe ad albero sono particolarmente utili nel caso di set di variabili più ampi, con livelli multipli. La Figura 3 mostra dati finanziari simili a quelli presentati in Figura 2. In questo caso, la variabile relativa ai diversi tipi di aziende ha ben sei livelli. Inoltre, c'è una variabile relativa alle dimensioni delle aziende. In questo esempio, quindi, le categorie di aziende sono più numerose che negli esempi precedenti. Le dimensioni dei rettangoli dipendono dalla media delle vendite in dollari USA. Inoltre, i rettangoli sono colorati a seconda del tipo di azienda e raggruppati in base alle dimensioni dell'azienda.

Figura 3: Mappa ad albero con molte variabili e categorie

Questa mappa ad albero mostra che le aziende petrolifere hanno la media di vendite più elevata in tutti i livelli della gerarchia, a prescindere dalle dimensioni. Le aziende produttrici di bevande, invece, hanno le vendite medie più basse tra le grandi imprese, ma non tra quelle di dimensioni medie o piccole: tra le piccole imprese, il valore più basso è associato alle aziende produttrici di sapone, mentre tra quelle di medie dimensioni è legato alle aziende aerospaziali.

Esempio 3: Mappa ad albero senza gerarchia

Le mappe ad albero possono aiutare anche a visualizzare dati privi di gerarchia. La mappa ad albero in Figura 4 mostra le ore totali di sonno di numerose specie animali. Le dimensioni dei rettangoli variano a seconda della durata della vita delle specie, mentre il loro colore riflette le ore di sonno.

Figura 4: Mappa ad albero di dati senza gerarchia

Dai colori della mappa ad albero in Figura 4 emerge che i pipistrelli registrano il maggior numero di ore totali di sonno. Dalle dimensioni dei rettangoli notiamo che il vespertilio bruno vive più a lungo del serotino bruno e che, nella mappa ad albero, sono gli esseri umani ad avere la durata di vita maggiore. 

Esempio n. 4: Categoria dell'asse y

Gli esempi precedenti erano relativi alle categorie, o gerarchie, sull'asse x. La Figura 5 mostra la gerarchia di categorie sull'asse y. I dati riguardano auto della metà degli anni '90 e le dimensioni dei riquadri della mappa ad albero dipendono dalle miglia autostradali per gallone (MPG) dei diversi modelli. La variabile sull'asse y indica se l'auto è stata prodotta negli Stati Uniti.

Figura 5: Mappa ad albero con categorie sull'asse delle y

Le mappe ad albero sono utili per visualizzare i pattern generali. Per esempio, i rettangoli arancioni sono generalmente più grandi dei rettangoli blu? La Geo Metro è l'auto con il valore di miglia per gallone più alto. In questo caso la visualizzazione risulterebbe più semplice con l'utilizzo della guida al passaggio del mouse, poiché mostrerebbe le miglia per gallone di ogni rettangolo. Il software ha disposto automaticamente le auto in ordine alfabetico.

Esempio n. 5: Due categorie 

Le mappe ad albero sono utili in caso di più categorie, dove le categorie definiscono la struttura. La mappa ad albero in Figura 6 mostra i ritardi di sei compagnie aeree e i giorni della settimana come variabili categoriche. Le dimensioni e il colore dei rettangoli dipendono dal ritardo medio degli arrivi.

Figure 6: Mappa ad albero con più categorie

Per tutte le compagnie aeree, il ritardo medio degli arrivi varia nei diversi giorni della settimana. Se vogliamo scegliere la compagnia aerea che ha in generale i ritardi minori, la mappa ad albero mostra che dovremmo optare per Southwest o Delta. Il ritardo medio di queste due compagnie è inferiore a otto minuti a inizio settimana e aumenta il giovedì e il venerdì. Il maggior ritardo medio è invece inferiore a 11 minuti. Al contrario, per American Airlines è il minor ritardo medio a essere di 11 minuti. Il minor ritardo medio dell'intera mappa ad albero è quello della Southwest Airlines del martedì. Il maggior ritardo medio è invece quello della American Airlines del venerdì.