Similitudes y diferencias entre Z-test y T-test

 

Una primera similitud muy evidente es que los dos tests se refieren al parámetro μ de una distribución Normal. Como es sabido, la diferencia se encuentra en que en el Z-test se supone que la σ poblacional es conocida, mientas que en el T-test es desconocida:

Z-test

T-test

H0: μ = μ0 (σ conocida)

H0: μ = μ0 (σ desconocida)

Los estadísticos que se utilizan en los dos tests también presentan coincidencias:

Z-test

T-test

Vemos que ambas fórmulas difieren, tan sólo, en que en el estadístico del Z-test aparece en el denominador la desviación típica poblacional (conocida), mientras que en el T-test tenemos un estimador insesgado de dicho parámetro. Sin embargo, conviene no olvidar que las distribuciones de referencia de ambos estadísticos no son las mismas:

Z-test (supuesta H0 cierta)

T-test (supuesta H0 cierta)

Zexp ~ N(0, 1)

Texp ~ t de Student con n − 1 grados de libertad

Como ya sabemos, son dos distribuciones simétricas y con media cero. De hecho, la forma de las dos distribuciones es bastante similar, aunque la varianza de la distribución t de Student con n 1 grados de libertad es Var(T) = (n 1)/(n 2). Es decir, mayor que 1, la varianza de la Normal estándar N(0, 1), tal como se comprueba en el applet siguiente:

1) Desplazad la barra para cambiar los grados de libertad de la t de Student.

 

2) Visualizad cómo converge hacia la  Normal.

Es interesante observar que, cuando n tiende a infinito, la varianza de nuestra t de Student con n 1 grados de libertad tiende a uno:

es decir, a la varianza de la Normal tipificada. En realidad, las coincidencias van más allá, ya que una propiedad bien conocida es que, cuando los grados de libertad tienden a infinito, la distribución t de Student tiende a la N(0, 1).

Como ejemplo, en la siguiente tabla se muestran los percentiles del 95 % para diversas distribuciones de la t de Student con diferentes valores de los grados de libertad:

Grados de libertad 5 25 50 100 500 infinito
Percentil 95 % 2,015  1,708 1,676  1,660 1,648  1,645

Se comprueba que, a medida que aumentamos los grados de libertad, el percentil 95 de la t de Student se aproxima al valor de 1,645 que, como hemos visto en diversos ejercicios, es el percentil 95 de una distribución normal estándar.

Desde un punto de vista intuitivo, esta convergencia de la distribución t de Student hacia la Normal estándar, puede interpretarse en el sentido de que, cuanto mayor sea el tamaño de la muestra (y, por tanto, los grados de libertad en el contraste t de Student), mejor será la estimación de σ a través de la desviación muestral corregida.

De manera que, para un tamaño muestral muy grande, es de esperar que ambos valores sean muy similares. Por tanto, los estadísticos Zexp y Texp también lo serán y, en buena lógica, lo mismo sucede con las distribuciones correspondientes.

En síntesis, hemos visto que el Z-test o el T-test para la media de una normal presentan diversas similitudes que pueden resumirse indicando que cuanto mayor sea el tamaño muestral más se parecerán los valores del estadístico de contraste, su distribución y el p-valor.