La distribución t

¿Qué es la distribución t**?**

La distribución t describe las distancias estandarizadas de las medias de la muestra con respecto a la media de la población cuando se desconoce la desviación estándar de la población y las observaciones proceden de una población con distribución normal.

¿La distribución t es la misma que la distribución t de Student?

Sí.

¿Cuál es la diferencia principal entre las distribuciones t y z**?**

La distribución normal estándar o distribución z asume que se conoce la desviación estándar de la población. La distribución t se basa en la desviación estándar de la muestra.

Distribucióntcomparada con distribución normal

La distribución t es similar a una distribución normal. Tiene una definición matemática exacta. En lugar de adentrarnos en cálculos matemáticos complejos, veamos las propiedades útiles de la distribución t y por qué es importante en los análisis.

Considere el siguiente gráfico en el que se comparan tres distribuciones t con una distribución normal estándar:

Figura 1: Tres distribuciones t y una distribución normal estándar (z).

Todas las distribuciones tienen una forma alisada. Todas ellas son simétricas. Todas ellas tienen una media de cero.

La forma de la distribución t depende de los grados de libertad. Las curvas con más grados de libertad son más altas y tienen colas más delgadas. Las tres distribuciones t tienen “colas más gruesas” que la distribución z.

Se puede ver cómo las curvas con más grados de libertad se parecen más a una distribución z. Compare la curva rosa con un grado de libertad con la curva verde de la distribución z. La distribución t con un grado de libertad es más corta y tiene colas más gruesas que la distribución z. Compare luego la curva azul con 10 grados de libertad con la curva verde de la distribución z. Estas dos distribuciones son muy similares.

Una regla general común es que, para un tamaño muestral de al menos 30, se puede utilizar la distribución z en lugar de la distribución t . La figura 2 de abajo muestra una distribución t con 30 grados de libertad y una distribución z. En la figura se usa una curva verde de línea de puntos para z, para poder ver ambas curvas. Esta similitud es una de las razones por las que se utiliza una distribución z en los métodos estadísticos en lugar de una distribución t cuando los tamaños muestrales son lo suficientemente grandes.

Figura 2: Distribución z y distribución t con 30 grados de libertad.

Colas para pruebas de hipótesis y la distribución $t$

Cuando se realiza una prueba t, se verifica si el estadístico de la prueba es un valor más extremo que el esperado de la distribución t .

Para una prueba de dos colas, se examinan ambas colas de la distribución. En la figura 3 a continuación se muestra el proceso de decisión para una prueba de dos colas. La curva es una distribución t con 21 grados de libertad. El valor de la distribución t con α = 0.05/2 = 0.025 es 2.080. Para una prueba de dos colas, se rechaza la hipótesis nula si el estadístico de la prueba es mayor que el valor absoluto del valor de referencia. Si el valor del estadístico de la prueba está en la cola superior o en la inferior, la hipótesis nula se rechaza. Si el estadístico de la prueba está dentro de las dos líneas de referencia, entonces no se rechaza la hipótesis nula.

Figura 3: Proceso de decisión para una prueba de dos colas

Para una prueba de una cola, se examina únicamente una de las colas de la distribución. Por ejemplo, en la figura 4 a continuación se muestra el proceso de decisión para una prueba de una cola. La curva es de nuevo una distribución t con 21 grados de libertad. Para una prueba de una cola, el valor de la distribución t con α = 0.05 es de 1.721. Se rechaza la hipótesis nula si el estadístico de la prueba es mayor que el valor de referencia. Si el estadístico de la prueba está por debajo de la línea de referencia, entonces no se rechaza la hipótesis nula.

Figura 4: Proceso de decisión para una prueba de una cola

Cómo usar una tabla $t$

La mayor parte de personas utilizan software para efectuar los cálculos necesarios para las pruebas t. Pero en muchos libros de estadística aún hay tablas de t, así que puede ser útil saber cómo utilizarlas. En los siguientes pasos se describe cómo utilizar una tabla de t típica.

  1. Identifique si la tabla es para pruebas de dos colas o de una cola. A continuación, decida si su prueba es de una o de dos colas. En las columnas de una tabla de t se identifican distintos niveles de alfa.
    Si su tabla es para pruebas de una cola, aún puede utilizarla para una prueba de dos colas. Si establece α = 0,05 para su prueba de dos colas y solo tiene una tabla de una cola, utilice la columna para α = 0,025.
  2. Identifique los grados de libertad de sus datos. Las filas de una tabla t corresponden a diferentes grados de libertad. La mayor parte de tablas llegan hasta 30 grados de libertad y se paran. Las tablas asumen que las personas usarán una distribución z para tamaños muestrales mayores.
  3. Busque en la tabla la celda que se encuentra en la intersección del nivel α y los grados de libertad. Este es el valor de la distribución t. Compare su estadística con el valor de la distribución t y saque la conclusión apropiada.