La distribución F
Comparación de dos varianzas.
La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos poblaciones es evidente a partir del análisis de una sola población. Frecuentemente se desea comparar la precisión de un instrumento de medición con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que varía el procedimiento para calificar de un profesor universitario con la de otro.
Intuitivamente, podríamos comparar las varianzas de dos poblaciones, s12 y s22, utilizando la razón de las varianzas muestrales S21/S22. Si S21/S22 es casi igual a 1, se tendrá poca evidencia para indicar que s12 y s22 no son iguales. Por otra parte, un valor muy grande o muy pequeño para S21/S22, proporcionará evidencia de una diferencia en las varianzas de las poblaciones.
La variable aleatoria F se define como el cociente de dos variables aleatorias ji-cuadrada independientes, cada una dividida entre sus respectivos grados de libertad. Esto es,
donde χ21 y χ22 son variables aleatorias ji-cuadrada independientes con grados de libertad n1 y n2 respectivamente.
La variable aleatoria F es no negativa, y la distribución tiene un sesgo hacia la derecha. La distribución F es conocida como distribución de Fisher. Los valores de F se encuentran tabulados para diferentes grados de significación y la forma de manejar las tablas de F es similar a la que ya hemos visto para otras distribuciones. La tabla de F la encontrarán en los materiales auxiliares.
Supóngase que se tiene interés en dos poblaciones normales independientes, donde las varianzas de la población son desconocidas. Se desea probar la igualdad de las dos varianzas. Ya vimos que para poder comparar las medias de estas dos poblaciones se utiliza la distribución t de Student, en la cual podemos tener varianzas iguales o diferentes en la población (Caso de comparación de dos medias con varianza poblacional desconocida). Nuestro estadístico de prueba es:
Este caso es la comparación de dos muestras en cuanto a sus varianzas y tenemos tres posibles casos:
Ejemplo:
La variabilidad en la cantidad de grasa presente en un lote de un complemento dietético, utilizada para un proceso de fabricación de un alimento, depende del origen del complemento. Un fabricante que recibe el complemento de dos proveedores 1 y 2, hizo una comparación analizando muestras de ambos proveedores. Muestras de n1=10 y n2=16 mediciones de dos lotes produjeron las varianzas:
S21=1.25 y S22=0.5
¿Presentan los datos evidencia suficiente para indicar que la variabilidad en el contenido de grasa es menor para el producto que se recibe del proveedor 2? Realice una prueba con un a= 0.05.
Solución.
Tenemos nuestras hipótesis:
La Fcalc = 1.25/0.5 = 2.5
Como 2.5 < 2.5876 no se rechaza Ho, y se concluye con un a= 0.05 que no existe suficiente evidencia para decir que la variabilidad del contenido de grasa del complemento del proveedor 2 es menor que la del complemento suministrado por el proveedor 1.