Unidad 9. ESTADÍSTICA NO PARAMÉTRICA (IX)

9.5 PRUEBA DE KRUSKALL - WALLIS

Esta prueba es similar a la prueba anterior, de Mann – Whitney – Wilcoxcon, excepto que se aplica para cuando el número de poblaciones es mayor que dos. El número de poblaciones cuyo comportamiento se desea analizar, la denotaremos por K. Se puede aplicar cuando se trata de variables ordinales así como también cuando se trata de variables de intervalo o de relación.

A diferencia de la prueba de K – medias en el cual se requiere que las muestras sean independientes y provenientes de poblaciones normales y que sólo es aplicable para variables de intervalo o de relación, en este caso sólo se requiere que las muestras sean independientes. Es ampliamente usado cuando los supuestos de normalidad y las varianzas no son conocidas.

La prueba consiste en probar la hipótesis nula de que las poblaciones desde donde se extrae las muestras son iguales o que no existe diferencia significativa entre estas poblaciones.

Para ello se procede como en la prueba anterior, a ordenar todos los datos de las k muestras siempre disponiendo de la forma de reconocer la pertenencia de los datos a su respectiva muestra. A continuación se debe asignar rangos a cada elemento. Se procede a sumar los rangos por muestra.

Sea R1, R2,…, Rk la suma de estos rangos. Sean también n1, n2,…, nk los tamaños de cada una de las muestras, con n = n1 + n2 +… + nk. A continuación se calcula el estadístico H usando

El atributo particular demostrado por Kruskall y Wallis es que este estadístico puede ser aproximado a una distribución χ21-α(k-1)

Criterio de decisión:

Si el estadístico H es mayor que χ21-α) (k-1) entonces se rechaza Ho en cuyo caso estaremos en capacidad de afirmar que sí existe diferencia significativa entre las k poblaciones o éstas no son iguales. La prueba también nos permitirá identificar la población que mejor se adapte a nuestro análisis.

Ejemplo 07

Un agente exportador de anchoveta está interesado en comercializar estos productos y colocarlos en mercados asiáticos. De acuerdo a la información que tiene, en el norte del Perú existen tres grandes empresas pesqueras bien constituidas de las que puede adquirir dichos productos pero no sabe si existirá diferencia significativa en los volúmenes de exportación mensual.

Para ello se registraron las ventas de los últimos meses de las tres empresas pesqueras, los que se muestran en el cuadro contenido en las primeras tres columnas de la hoja KruskWallis01 del archivo Estad. no paramétrica.

A un nivel de significación del 5%, ¿se puede afirmar que el agente puede adquirir dichos productos de cualquiera de las empresas pesqueras?

Solución

Las hipótesis que vamos a probar son:

Ho: Es lo mismo elegir cualquiera de las empresas (Las poblaciones son idénticas)

H1: No se puede a elegir cualquiera de ellas (Las poblaciones son idénticas)

En la siguiente figura se muestran los datos y la primera parte del procedimiento.

En la columna G ya se han asignado el rango a cada uno de los datos.

En las celdas M4, M5, M6 y;M7, usando la función Contar.si() hemos obtenido los valores de n1, n2, n3 y el tamaño de la muestra, n, como la suma de ellas.

En las celdas del rango R4:U6 hemos obtenido la suma de los rangos, su cuadrado y el cociente Ri/ni.

En la celda N9 hemos calculado el estadístico H, que es el estadístico de la prueba y finalmente al comparar con el valor crítico decidimos rechazar la hipótesis formulada, lo que significa que existe diferencia significativa en el comportamiento de las tres empresas en términos de sus ventas. Del mismo modo podríamos afirmar que se puede seleccionar a la empresa pesquera C.

 

Pág. 9.9

Atrás  Inicio  Adelante





Página inicial  Cursos Informática Gratuitos

Síguenos en:   Facebook       Sobre aulaClic            Política de Cookies