5. Análisis de datos categóricos (1)

 

 

  

El estudio de la Estadística Inferencial no sólo se ocupa de variables cuyo comportamiento está determinado por ciertos parámetros que la definen. Se ocupa también de variables cuya distribución no es conocida, pero con las cuales se podría formular ciertas hipótesis que pueden ser validadas con ayuda de las distribuciones como la Distribución Chi – Cuadrado, que proporciona una colaboración eficiente para estos temas. Por otro lado, no siempre el análisis estadístico se realiza sobre datos cuantitativos, en muchos casos éstos son de naturaleza cualitativa.

 

El conjunto de estas variables se clasifican por categorías, cada una de las cuales pueden pertenecer a una determinada población. Si bien el análisis comparativo de dos poblaciones lo cubre la diferencia de medias o proporciones poblacionales, en este caso estamos hablando de una comparación de más de dos poblaciones. De manera que, aún en el caso de que tuviéramos variables con un determinado comportamiento, se trata de plantear comparaciones de múltiples variables cada una de las cuales podrían tener una distribución conocida: Se pueden realizar pruebas de Bondad de Ajuste para variables multinomiales, para variables normales o con una distribución de Poisson. También se puede probar la afirmación de que un conjunto de datos se ajusta a una de estas distribuciones conocidas.

 

Por ello estamos interesados en medir la independencia de estas variables categóricas; se trata de analizar su homogeneidad o el tipo de ajuste que pudieran tener. Esto significa  realizar prueba de hipótesis para la independencia de variables, para la homogeneidad de las mismas o, probar la bondad de su ajuste hacia alguna distribución conocida.

 

Por otro lado, desde el punto de vista de la estadística, luego de conocer el valor del estadístico en una muestra, interesa medir el desvío que presentan respecto de su valor esperado; es decir, interesa medir, por ejemplo  , en el caso de la media. Y como esta diferencia puede ser cero (como en este), es más importante analizar  que constituye la suma de los errores en la estimación del parámetro.

 

La distribución Chi – Cuadrado será un instrumento que nos permitirá evaluar este tipo de comparaciones y determinar la aceptación o rechazo de las hipótesis de igualdad, como lo veremos en las siguientes secciones.

En este capítulo desarrollaremos los siguientes temas:

 

1.     Pruebas de Bondad de Ajuste

2.     Pruebas de Independencia: Tablas de Contingencia

3.     Análisis de Varianza (ANOVA)

Pág. 5.1

Atrás  Inicio  Adelante






Página inicial  Cursos Informática Gratuitos

Síguenos en:   Facebook       Sobre aulaClic            Política de Cookies