Inferencia respecto a la varianza poblacional
Supongamos que se efectúa el siguiente experimento estadístico: Seleccionamos una muestra aleatoria de tamaño n de una población con distribución normal, con desviación estándar igual a σ. De la muestra encontramos que la desviación estándar es igual a s. Con estos datos podemos calcular una estadística, que llamamos χ2, por medio de la siguiente ecuación:
$$\chi^2=\frac{(n-1)s^2}{\sigma^2}$$
Si repetimos el experimento un número infinito de veces, obtendríamos una distribución muestral para el estadístico χ2. Pero la distribución final que tendríamos se puede definir por la siguiente ecuación:
$$Y=Y_0\chi^2 \left ( \frac{v}{2}-1\right )e^{-\frac{\chi^2}{2}}$$
Donde Y0 es una constante que depende del número de grados de libertad (ν = n – 1, n es el tamaño de la muestra), χ2 es el valor de chi-cuadrada y e es el llamado número natural (aproximadamente 2.71828). Y0 se define de forma que el área bajo la curva sea igual a 1.
Si graficamos curvas para diferentes valores de n, encontramos que la forma de la distribución χ2 cambia dependiendo del número de grados de libertad.
También vemos que al aumentar el número de grados de libertad, la curva se aproxima a la distribución normal.
La distribución χ2 tiene las siguientes siguientes propiedades:
-
-
- La media es igual al número de grados de libertad libertad (que es igual al tamaño de las muestras menos 1): μ = ν = n – 1
- La varianza es igual a dos veces el número de grados de libertad libertad (por lo tanto la desviación estándar es la raíz cuadrada de 2ν):σ2 = 2 * ν
- Cuando los grados de libertad libertad son mayores mayores o iguales que 2, el máximo valor de Y ocurre cuandoχ2 = ν – 2
- Conforme los grados de libertad (tamaño de la muestra muestra) aumenta, la distribución χ2 se aproxima a la distribución normal.
-
La distribución χ2, como otras distribuciones por ejemplo la t de student y la z-normal estándar, se construye de forma que el área total bajo la curva sea igual a 1. El área bajo la curva entre 0 y un valor particular de la estadística χ2 es la probabilidad asociada con ese valor. Por ejemplo, en la figura, el área representa la probabilidad acumulada para una χ2 igual a un valor x.
Estas áreas las encuentras en la tabla IV distribución de χ2
La distribución χ2 es una de las distribuciones más empleadas en estadística. Su uso más común es cuando se quiere probar si unas mediciones que se hayan efectuado siguen una distribución esperada, por ejemplo la normal o cualquier otra. Estas pruebas se denominan de bondad de ajuste. Otro de sus usos es en intervalos de confianza y pruebas de hipótesis para las varianzas o desviaciones estándar. También se usa comparar frecuencias observadas y esperadas en tablas de contingencia.
Ejemplo
Se considera una medición física realizada con un instrumento de precisión, donde el interés se centra en la variabilidad de la lectura. Se sabe que la medición es una variable aleatoria con distribución Normal y desviación estándar de 4 unidades. Se toma una muestra aleatoria simple de tamaño 25.
Obtener la probabilidad de que el valor de la varianza muestral sea mayor de 12.16 unidades.
Sabemos que la distribución χ2 se comporta como
$$\chi^2=\frac{(n-1)s^2}{\sigma^2}\longrightarrow \chi^{2}_{n-1}$$
n=25
σ=4
s2=12.16
$$\chi^2=\frac{(25-1)12.16}{4^2}= 18.24$$
Buscamos en la tabla IV Distribución de χ2 el valor tal que P[x > 12.16]=18.28
Vemos que es el área bajo la curva, después del valor de x, por lo que buscaremos en la tabla el valor para 24 G.L. y mayor a 18.28. Este valor es 19.037, que corresponde a una probabilidad de 0.75.