Der t-Test

Was ist ein t-Test?

Ein t-Test (entwickelt von William Sealy Gosset unter dem Pseudonym „Student“, daher auch „Student's t-Test“) ist ein Werkzeug zum Vergleich der Mittelwerte von ein oder zwei Populationen mittels Hypothesentests. Ein t-Test kann verwendet werden, um zu bewerten, ob eine einzelne Gruppe von einem bekannten Wert abweicht (Ein-Stichproben-t-Test), ob sich zwei Gruppen voneinander unterscheiden (unabhängiger Zwei-Stichproben-t-Test), oder ob es einen signifikanten Unterschied bei paarweisen Messungen gibt (paarweiser t-Test bzw. t-Test abhängiger Stichproben).

Wie werden t-Tests verwendet?

Zuerst definieren Sie die Hypothese, die Sie testen möchten, und legen ein akzeptierbares Risiko für den Fall fest, eine falsche Schlussfolgerung zu ziehen. Zum Beispiel können Sie für den Vergleich von zwei Populationen die Hypothese aufstellen, dass ihre Mittelwerte gleich sind, und eine akzeptierbare Wahrscheinlichkeit dafür festlegen, dass Sie das Vorhandensein eines Unterschieds schlussfolgern, obwohl das nicht stimmt. Als Nächstes berechnen Sie aus Ihren Daten eine Prüfgröße und vergleichen diese mit einem theoretischen Wert aus einer t-Verteilung. Abhängig vom Ergebnis können Sie Ihre Null-Hypothese entweder verwerfen oder nicht.

Was ist, wenn ich mehr als zwei Gruppen habe?

Dann können Sie keinen t-Test verwenden. Nutzen Sie Methoden für multiple Vergleiche. Beispiele dafür sind die Varianzanalyse (ANOVA), der Tukey-Kramer-Test für paarweise Vergleiche, die Dunnett-Methode zum Vergleich mit einer Kontrolle und die Mittelwertanalyse (ANOM).

Annahmen für einen t-Test

Eigentlich sind t-Tests relativ robust gegenüber Abweichungen von den Annahmen, doch für t-Tests gelten die folgenden Voraussetzungen:

  • Die Daten sind stetig.
  • Die Stichprobendaten wurden zufällig aus einer Population entnommen.
  • Es besteht Varianzhomogenität (d. h. die Variabilität der Daten innerhalb der einzelnen Gruppen ist ähnlich).
  • Die Verteilung ist annähernd normal.

Für Zwei-Stichproben-t-Tests brauchen wir unabhängige Stichproben. Wenn die Stichproben nicht unabhängig sind, ist möglicherweise ein paarweiser t-Test die geeignete Methode.

Arten von t-Tests

Es gibt drei verschiedene t-Tests zum Vergleich von Mittelwerten: den Ein-Stichproben-t-Test, den Zwei-Stichproben-t-Test und den paarweisen t-Test. In der folgenden Tabelle werden die Eigenschaften der einzelnen Methoden zusammengefasst und Sie erhalten Tipps zur Auswahl der passenden Testmethode. Besuchen Sie die jeweiligen Seiten zu den einzelnen Arten von t-Tests, wenn Sie Beispiele und Einzelheiten zu den Annahmen und Berechnungen benötigen.

 Ein-Stichproben-t-TestZwei-Stichproben-t-TestPaarweiser t-Test
SynonymeStudent’s t-Test
  • t-Test unabhängiger Gruppen
  • t-Test unabhängiger Stichproben
  • t-Test auf gleiche Varianzen
  • Gepoolter t-Test
  • t-Test auf ungleiche Varianzen
  • t-Test paarweiser Gruppen
  • t-Test abhängiger Stichproben
Anzahl der VariablenONEZweiZwei
Art der Variable
  • Stetige Messung
  • Stetige Messung
  • Gruppendefinition kategorial oder nominal
  • Stetige Messung
  • Paarung innerhalb der Gruppe kategorial oder nominal
Zweck des TestsEntscheidung, ob der Populationsmittelwert gleich einem spezifischen Wert istEntscheidung, ob die Populationsmittelwerte für zwei verschiedene Gruppen gleich sindEntscheidung, ob die Differenz zwischen paarweisen Messungen für eine Population null ist
Beispiel: Testen, ob …der Mittelwert der Herzfrequenz einer Gruppe Menschen gleich 65 istdie Mittelwerte der Herzfrequenz von zwei Gruppen an Menschen gleich sind oder sich unterscheidendie mittlere Differenz der Herzfrequenz einer Gruppe Menschen vor und nach körperlicher Betätigung null ist
Schätzer eines PopulationsmittelwertsStichprobendurchschnittStichprobendurchschnitt pro GruppeStichprobendurchschnitt der Differenzen paarweiser Messungen
Standardabweichung für die PopulationUnbekannt, Standardabweichung der Stichprobe verwendenUnbekannt, Standardabweichungen der Stichproben der einzelnen Gruppen verwendenUnbekannt, Standardabweichung der Differenzen in paarweisen Messungen für die Stichprobe verwenden
FreiheitsgradeAnzahl der Beobachtungen in Stichprobe minus 1, oder:
n  – 1
Summe der Beobachtungen in jeder Stichprobe minus 2, oder:
n1 + n2 – 2
Anzahl der paarweisen Beobachtungen in der Stichprobe minus 1, oder:
n – 1

Die Tabelle zeigt nur die t-Tests für Populationsmittelwerte. Ein weiterer gängiger t-Test untersucht Korrelationskoeffizienten.Diesen t-Test verwenden Sie zur Entscheidung, ob der Korrelationskoeffizient signifikant von null verschieden ist.

Tests mit einem Verteilungsende vs. Tests mit zwei Verteilungsenden

Wenn Sie die Hypothese definieren, legen Sie auch fest, ob Sie einen Test mit einem oder mit zwei Verteilungsenden durchführen. Diese Entscheidung sollten Sie treffen, bevor Sie Ihre Daten erfassen oder Berechnungen anstellen. Diese Entscheidung müssen Sie für alle drei Arten von t-Tests auf Mittelwerte treffen.

Ziehen wir zur Erklärung den Ein-Stichproben-t-Test heran. Angenommen, wir haben eine zufällige Stichprobe aus Proteinriegeln und auf der Verpackung der Riegel wird ein Wert von 20 Gramm Protein pro Riegel angepriesen. Die Null-Hypothese lautet, dass der unbekannte Populationsmittelwert 20 beträgt. Wir wollen im Beispiel einfach nur wissen, ob uns die Daten einen unterschiedlichen Populationsmittelwert zeigen. In diesem Fall lauten unsere Hypothesen:

$ \mathrm H_o: \mu = 20 $

$ \mathrm H_a: \mu \neq 20 $

Hier haben wir es mit einem Test mit zwei Verteilungsenden zu tun. Wir werden die Daten nutzen, um herauszufinden, ob sich der Stichprobendurchschnitt ausreichend nach oben oder nach unten von 20 unterscheidet, um daraus die Schlussfolgerung abzuleiten, dass der unbekannte Populationsmittelwert von 20 verschieden ist.

Wenn wir stattdessen wissen möchten, ob das Werbeversprechen auf der Verpackung stimmt, müssen wir anders vorgehen und fragen: Unterstützen die Daten die Vorstellung, dass der unbekannte Populationsmittelwert mindestens 20 beträgt? Oder trifft diese Aussage nicht zu? In diesem Fall lauten unsere Hypothesen:

$ \mathrm H_o: \mu >= 20 $

$ \mathrm H_a: \mu < 20 $

Hier haben wir es mit einem Test mit einem Verteilungsende zu tun. Wir werden die Daten nutzen, um herauszufinden, ob der Stichprobendurchschnitt ausreichend unter 20 liegt, um die Hypothese zu verwerfen, dass der unbekannte Populationsmittelwert mindestens 20 beträgt.

Im Abschnitt „Verteilungsenden für Hypothesentests“ auf der Seite „t-Verteilung“ finden Sie übersichtliche konzeptionelle Darstellungen von Tests mit einem und zwei Verteilungsenden.

So führen Sie einen t-Test durch

Bei allen t-Tests, die Mittelwerte berücksichtigen, führen Sie in der Analyse dieselben Schritte durch:

  1. Definieren Sie Ihre Null-Hypothese ($ \mathrm H_o $) und Alternativhypothese ($ \mathrm H_a $), bevor Sie Ihre Daten erfassen.
  2. Legen Sie den Alpha-Wert (bzw. α-Wert) fest. Dazu müssen Sie das Risiko einer falschen Schlussfolgerung festlegen, das Sie einzugehen bereit sind. Sie können zum Beispiel für α = 0,05 festlegen, wenn Sie zwei unabhängige Gruppen vergleichen. In diesem Fall legen Sie ein Risiko von 5 % für den Fall fest, die Schlussfolgerung zu ziehen, dass die unbekannten Populationsmittelwerte unterschiedlich sind, obwohl sie es in Wirklichkeit nicht sind.
  3. Prüfen Sie die Daten auf Fehler.
  4. Prüfen Sie die Annahmen für den Test.
  5. Führen Sie den Test durch und ziehen Sie Ihre Schlussfolgerung. Für alle t-Tests auf Mittelwerte muss eine Prüfgröße berechnet werden. Sie vergleichen die Prüfgröße mit einem theoretischen Wert aus der t-Verteilung. Der theoretische Wert berücksichtigt sowohl den α-Wert als auch die Freiheitsgrade für Ihre Daten. Weitere Details finden Sie auf den jeweiligen Seiten zum Ein-Stichproben-t-Test, dem Zwei-Stichproben-t-Test und dem paarweisen t-Test.