5. Análisis de datos categóricos (2)

1.   Pruebas de Bondad de Ajuste

 

Fundamento:

 

Sea X1, X2, ..., Xk un conjunto de categorías mutuamente excluyentes extraídas de una población(puede ser Binomial, Normal o Poisson, Exponencial, etc.).

 

Supongamos que  pi: representa la probabilidad de ocurrencia de un elemento cualquiera de la población (llámese Binomial, Poisson o Normal, etc.)

 

Supongamos también que  pXi : representa la probabilidad de ocurrencia de Xi  , en la i - ésima categoría,  para i = 1, 2, ..., k

 

Los pXi  representan también la frecuencia relativa para cada Xi  

 

¿Podríamos afirmar si la probabilidad de ocurrencia de un valor de la variable poblacional es la misma que la “probabilidad” de ocurrencia del mismo valor en una variable muestral?

 

Si esto fuera cierto y, si la respuesta es positiva para cada uno de las categorías, entonces diríamos que el comportamiento de los datos en la muestra se ajustan a la distribución seleccionada en la hipótesis y que gozan de su comportamiento.

 

Ahora bien, qué tan bueno puede ser dicho ajuste?

 

Usaremos la prueba de hipótesis para responder a esta pregunta.

 

Sea  H0 : La proporción de éxitos en la muestra coincide con la probabilidad de éxito.

 

Podemos probar la Hipótesis Nula con un nivel de significación de 100(1-a)%.

Para ello, supongamos que

 

H0 : pXi = pi  para i = 1, 2, ..., k

H1 : pXi  ¹ pi  para i = 1, 2, ..., k

 

Para aceptar o rechazar la hipótesis nula primero debemos realizar los cálculos a partir de un conjunto de datos Xi.

 

Procedimiento:

 

Debemos obtener la Frecuencia Observada,  Oi para cada categoría (Xi)

 

A continuación se deberá obtener una columna para la Frecuencia Esperada, tomando en cuenta el tipo de población de la cual se ha extraído la muestra:

 

Si fuera binomial, la Frecuencia Esperada para la i-ésima categoría será Ei = npi.

Si la población fuera Normal, Ei = mi.

Si la población es Poisson, entonces  Ei = li.

 

Luego en las dos columnas siguientes debemos obtener la diferencia (frecuencia observada menos frecuencia esperada, O- Ei) y los cuadrados de la misma.

 

La suma de ellos se deberá comparar con el valor Chi – Cuadrado con k – 1 grados de libertad que nos entregue el Minitab, donde k representa el número de categorías.

 

Se rechazará la Hipótesis Nula si     >  (k-1)

 

En consecuencia, se trata de completar la siguiente tabla:

 

 

      Categoría

Frecuencia observada(Oi)

Frecuencia esperada(Ei)

 

 (Oi – Ei)²

 

(Oi – Ei)²/Ei

X1

O1

E1

 

 

X2

O2

E2

 

 

...

 

 

 

 

...

 

 

 

 

Xk

Ok

Ek

 

 

 

Total

 

 

 

 

El valor de   > =   será contrastado con el  (k-1- r) de la tabla

Donde r representa el número de parámetros a estimar.

 

Nota:

 

Si el número de observaciones para una determinada categoría fuese menor a 5, se procede a fusionar con la categoría contigua.

 

Pág. 5.2

Atrás  Inicio  Adelante






Página inicial  Cursos Informática Gratuitos

Síguenos en:   Facebook       Sobre aulaClic            Política de Cookies