5. Análisis de datos categóricos (13)

3.   Análisis de la varianza

 

 

Si bien la distribución muestral de la diferencia de medias muestrales permite realizar una comparación entre dos poblaciones, cuando se trata de más de dos poblaciones el procedimiento estudiado no lo permite. Y en la práctica hay muchas situaciones en las que debemos realizar comparaciones de medias entre más de dos poblaciones.

 

Para resolver estos tipos de problemas usaremos el Análisis de Varianza

 

El Análisis de Varianza (ANOVA) permite estudiar la relación de dependencia que puede existir entre un conjunto de variables independientes a las cuales se denominan Tratamientos o variables explicativas y una variable dependiente llamada también variable explicada o variables de respuesta.

 

En este sentido un ANOVA se comporta como un análisis de regresión excepto que un Análisis de Varianza no supone dependencia y la prueba puede llevarse a cabo sobre variables de diferentes categorías, tanto cuantitativas como cualitativas.

 

Fundamentación:

 

Supongamos que m1, m2  y  m3  representan las calificaciones medias de tres poblaciones que poseen determinada característica sujeta a estudio.

 

Supongamos que la hipótesis de estudio consiste en afirmar que el comportamiento promedio en las tres poblaciones es la misma.

 

Esto quiere decir que m1  =  m2  =  m3 .

 

Para ello probar esta hipótesis los resultados del muestreo nos permitirá formular la hipótesis alternativa en la que se afirme que dichos promedios son diferentes, con (1-a)100% de confianza.

 

Por lo expuesto, debemos realizar la siguiente prueba:

 

H0: m1  =  m2  =  m3

H1: Hay diferencia por lo menos en un par de calificaciones promedio

 

Matemáticamente el análisis de la varianza se fundamenta en la demostración por el absurdo:

 

Puesto que queremos probar la igualdad de las medias, tomaremos como verdadera la hipótesis alternativa; es decir, que hay diferencia entre ellas.

 

Si esto es cierto, entonces mediremos el desvío o error de medición entre las medias muestrales (entre tratamientos) y el promedio de las medias muestrales.

 

Del mismo modo evaluaremos la variabilidad dentro de cada población (dentro de tratamientos)  tomando en cuenta el error o desvío entre la media muestral y su promedio, en cada población.

 

Si la suma de estos cuadrados medios es bastante grande estaremos en posibilidad de rechazar la hipótesis nula.

 

Para ello el Análisis de Varianza requiere de tres supuestos:

 

1.     Para cada población, la variable respuesta (el dato observado, variable dependiente) tiene una distribución normal.

 

2.     La varianza de la variable respuesta s²  es la misma para todas las muestras

 

3.     Las observaciones deben ser independientes

 

De manera que si

 

            Xij    :  Es la i-ésima observación, correspondiente al j-ésimo tratamiento

            mj      :  Es la media de la j-ésima población

                :  Es la media muestral de la j-ésima muestra(tratamiento)

                 :  Es la varianza muestral del j-ésimo tratamiento

 

                  : Es la media muestral de las medias muestrales

 

            n   =  n 1 +  n 2 + ... + n k    donde k: Total de tratamientos ( k muestras)

 

 

Calculemos ahora la Suma de los Cuadrados entre los Tratamientos (SSTR):

 

            ,

 

Que nos permitirá calcular el Cuadrado Medio entre Tratamientos 

 

Del mismo modo, calculemos la Suma de los Cuadrados dentro de los Tratamientos (SSE):

 

           

 

Que nos permitirá calcular el Cuadrado Medio debido al Error 

 

 

Pág. 5.13

Atrás  Inicio  Adelante






Página inicial  Cursos Informática Gratuitos

Síguenos en:   Facebook       Sobre aulaClic            Política de Cookies