Analisi dei dati > Analisi delle relazioni > Confronto di medie per una variabile
Data di pubblicazione: 10/08/2021

Confronto di medie per una variabile

Se si ha una variabile Y continua e una variabile X categorica, è possibile confrontare le medie sui livelli della variabile X.

Scenario

Questo esempio utilizza la tabella di dati Companies.jmp, che contiene dati finanziari relativi a 32 società farmaceutiche e di informatica.

Un analista finanziario desidera dare una risposta alla seguente domanda:

Come è possibile confrontare i ricavi delle aziende di informatica con i ricavi delle società farmaceutiche?

Per rispondere a questa domanda, stimare Profits ($M) rispetto a Type.

Individuazione della relazione

1. Selezionare Guida > Libreria dei dati di esempio e aprire Companies.jmp.

2. Se la tabella di dati Companies.jmp è ancora aperta, è probabile che alcune righe siano escluse o nascoste. Per riportare le righe allo stato predefinito (tutte le righe incluse e nessuna nascosta), selezionare Righe > Cancella stati delle righe.

3. Selezionare Analizza > Stima Y rispetto a X.

4. Selezionare Profits ($M) e fare clic su Y, Risposta.

5. Selezionare Type e fare clic su X, Fattore.

6. Fare clic su OK.

Figura 5.15 Ricavi per tipo di società 

Image shown here

È presente un outlier nel tipo Computer. L'outlier estende la scala del grafico rendendo difficoltoso il confronto dei ricavi. Escludere e nascondere l'outlier:

1. Fare clic sull'outlier.

2. Selezionare Righe > Escludi/Annulla esclusione. Il punto di dati non è più incluso nei calcoli.

3. Selezionare Righe > Nascondi/Mostra. Il punto di dati scompare da tutti i grafici.

4. Per ricreare il diagramma senza l'outlier, fare clic su Analisi a una via di Profits ($M) By Type e selezionare Ripeti > Ripeti analisi. È possibile chiudere la finestra originale del grafico a dispersione.

Figura 5.16 Grafico aggiornato 

Image shown here

La rimozione dell'outlier offre all'analista finanziario una visione più chiara dei dati.

5. Per continuare ad analizzare la relazione, selezionare queste opzioni dal menu associato al triangolo rosso di Analisi a una via di Profits ($M) By Type:

Opzioni di visualizzazione > Linee della media. Vengono aggiunte linee della media al grafico a dispersione.

Medie e Dev std. Viene visualizzato un report che fornisce le medie e le deviazioni standard.

Figura 5.17 Linee della media e report 

Image shown here

Interpretazione dei risultati

L'analista finanziario desiderava sapere come confrontare i ricavi delle aziende di informatica con i ricavi delle società farmaceutiche. Il grafico a dispersione aggiornato mostra che le società farmaceutiche hanno ricavi medi più elevati rispetto alle aziende di informatica. Nel report, se si sottrae un valore medio dall'altro, la differenza nei ricavi è di circa $635 milioni. Il grafico mostra anche che alcune aziende di informatica hanno ricavi in negativo, mentre tutte le società farmaceutiche hanno ricavi in positivo.

Esecuzione deltest t

L'analista finanziario ha preso in esame soltanto un campione di società (le società presenti nella tabella di dati) e ora desidera dare una risposta alle seguenti domande:

Esiste una differenza nella popolazione più ampia o la differenza di $635 milioni è casuale?

Se esiste una differenza, qual è?

Per rispondere a tali domande, eseguire un test t a due campioni. Un test t consente di utilizzare i dati di un campione per creare inferenze sulla popolazione più ampia.

Per eseguire il test t fare clic sul triangolo rosso associato ad Analisi a una via e selezionare Medie/ANOVA/test t aggregato.

Figura 5.18 Risultati del test t 

Image shown here

Il p-value di 0.0001 è minore del livello di significatività di 0.05, a indicare la significatività statistica. Di conseguenza, l'analista finanziario può concludere che la differenza osservata nei ricavi medi per i dati di esempio è statisticamente significativa. Ciò significa che nella popolazione più ampia, i ricavi medi delle società farmaceutiche sono diversi dai ricavi medi delle aziende di informatica.

Conclusioni

Utilizzare i limiti degli intervalli di confidenza per determinare la differenza esistente nei ricavi di entrambi i tipi di società. Osservare i valori Diff CL superiore e Diff CL inferiore nella Figura 5.18. L'analista finanziario conclude che i ricavi medi delle società farmaceutiche sono, per una cifra compresa fra $343 e $926 milioni, maggiori rispetto ai ricavi medi delle aziende di informatica.

Vuoi maggiori informazioni? Hai domande? Ottieni risposte nella community di utenti JMP (community.jmp.com).