Grafico a linee

Cos'è un grafico a linee?

Un grafico a linee mostra i cambiamenti di una variabile continua nel tempo. Altri nomi possibili per i grafici a linee sono grafici lineari, diagrammi a linee, grafici delle tendenze, carte sequenziali o grafici delle serie storiche.

I grafici a linee mostrano i cambiamenti nel tempo

I grafici a linee mostrano l'evolversi di variabili continue nel tempo. La variabile di misura del tempo è rappresentata sull'asse x. La variabile continua è rappresentata sull'asse y.

Esempi di grafici a linee

Esempio 1: grafici a linee base

Il grafico in figura 1 mostra le variazioni di peso di un pappagallo, misurate in diversi momenti nel tempo. Nel grafico vengono visualizzati sia i punti di dati sia una linea. Volendo, è possibile omettere i punti. La presenza di un asse del peso ha senso, considerati i dati a disposizione. Inoltre, le etichette degli assi sono molto utili. Il grafico consente di vedere come il peso del pappagallo, misurato in grammi, varia nel tempo.

Figura 1: Grafico a linee base che mostra la variazione di peso nel tempo

Nell'ambito del controllo qualità, un grafico lineare base come quello precedente viene chiamato carta sequenziale. La carta sequenziale mostra “l'andamento nel tempo” dei valori di una variabile sull'asse delle y. 

Esempio n. 2: Considerare i valori mancanti

Il grafico a linee in Figura 2 si riferisce sempre ai dati sul peso di un pappagallo. In questo caso, in alcuni giorni il peso del pappagallo non è stato rilevato come pianificato. Il grafico a linee non unisce i valori mancanti. Inoltre, è stata aggiunta una nota per sottolineare la presenza di dati mancanti nel grafico a linee. In alternativa, è possibile unire i valori mancanti con una linea continua o tratteggiata. Bisogna fare molta attenzione ai valori mancanti e alla loro rappresentazione nei grafici.

Figura 2: Grafico a linee con valori mancanti

Esempio 3: Quando usare una regressione al posto di un grafico a linee

La Figura 3 mostra un grafico a dispersione di due variabili continue. Sull'asse x è rappresentato il peso corporeo, mentre sull'asse y le ore di sonno. Nel grafico i punti sono erroneamente collegati da una linea. I punti si riferiscono a diverse specie animali e non presentano una relazione che mostra variazioni nel tempo. Nella Figura 4 vediamo un grafico a dispersione con una regressione lineare semplice, che costituisce il modo corretto di rappresentare questi dati.

Figura 3: Uso errato di un grafico a linee
Figura 4: Questo grafico a dispersione con regressione lineare è più utile rispetto al grafico a linee in Figura 3

Esempio 4: Attenzione alla scala sull'asse delle y

Nel creare un diagramma a linee o un grafico di qualsiasi tipo è importante tenere presente la scala utilizzata. Per esempio, in passato i manuali raccomandavano di includere lo zero sull'asse delle y, mentre oggi si consiglia di usarlo solo se ha senso per i propri dati. La figura 5 mostra la cronologia dei tassi di occupazione delle camere d'albergo d'Australia nell'ultimo trimestre di diversi anni. L'asse delle y segue le raccomandazioni di una volta, partendo da zero. Il problema di questo approccio è che minimizza l'impatto visivo delle differenze tra un anno e l'altro. Confrontiamo le figure 5 e 6: la figura 6 usa un set di valori molto più ragionevole per l'asse y, rendendo molto più semplice vedere il picco raggiunto nel 2006. Molti strumenti software creano automaticamente un asse delle y adatto ai dati analizzati e a volte consentono anche di modificare gli assi.

Figura 5: Grafico a linee con lo zero sull'asse delle y
Figura 6: La differenza tra i vari anni è più semplice da osservare quando sull'asse delle y non c'è lo zero

Esempio n. 5: Linee multiple per categorie diverse

I grafici a linee possono includere linee multiple. Il grafico riportato in Figura 7 mostra i dati storici sulle quote di mercato dei diversi sistemi operativi per smartphone a partire dal 2006 (quando sono stati lanciati i primi dispositivi) fino al 2011. Ogni linea mostra la variazione nel tempo relativa ai diversi sistemi operativi. 

Figura 7: Linee multiple in un grafico a linee, codificate per colore

Quando si crea un grafico a linee con più linee, è importante pensare ai colori da utilizzare a seconda delle modalità di condivisione e visualizzazione del grafico. Sarà sempre a colori? O sarà in bianco e nero? Bisogna assicurarsi che i colori siano ben distinguibili anche nelle stampe non a colori. In aggiunta o in alternativa ai colori, si possono usare diversi stili di linea. Le legende sono utili se nel grafico ci sono poche linee, in caso contrario possono creare confusione. Tuttavia, è meglio ricorrervi quando si usa un'altra variabile per definire le diverse linee del grafico. 

Il grafico a linee in Figura 7 presenta linee continue di colori diversi per i due sistemi operativi che hanno registrato un aumento delle quote di mercato nel tempo. I colori scelti sono abbastanza diversi per essere distinti facilmente anche nelle stampe in bianco e nero. Per i sistemi operativi che hanno registrato una diminuzione delle quote di mercato nel tempo vengono invece usate due diverse linee tratteggiate. Il grafico contiene anche una legenda nell'angolo in alto a sinistra. 

Grafici a linee e tipi di dati

In un grafico a linee, la variabile sull'asse x definisce il tempo. Molti strumenti software memorizzano questa variabile come una variabile continua.

Dati continui e grafici a linee

I grafici a linee sono utili per visualizzare i dati continui sull'asse y, perché si tratta di dati misurati su scale con molti valori possibili. Esempi di dati continui:

  • Età
  • Pressione sanguigna
  • Peso
  • Temperatura
  • Velocità

Per tutti questi esempi, il grafico a linee è uno strumento visivo adatto a mostrare i cambiamenti di una variabile nel tempo.

Dati categorici o nominali: scegliere un altro tipo di grafico

I grafici a linee non sono adatti per rappresentare i dati categorici o nominali sull'asse y, perché si tratta di dati misurati su una scala con valori specifici.

Nel caso di dati categorici, il campione viene diviso in gruppi e le risposte possono avere un ordine ben definito. Per esempio, in un sondaggio in cui viene chiesto di dare la propria opinione su una scala da “Per niente d'accordo” a “Molto d'accordo” le risposte sono categoriche.

Nel caso di dati nominali, il campione è sempre diviso in gruppi, che però non seguono un ordine particolare. Un esempio di variabile nominale è il paese di residenza. La codifica può essere la sigla del nome del paese oppure un numero, ma in ogni caso si tratta solo di attribuire un nome a gruppi di dati diversi.

È possibile usare variabili categoriche o nominali come variabile di raggruppamento per aggiungere più gruppi con linee multiple a un grafico a linee, come mostrato in Figura 7.