Unidad 2. ESTADíSTICA DESCRIPTIVA (XXV)

2.11 ASIMETRÍA

El comportamiento de los datos en cuanto a su posición y su variabilidad se puede medir mediante los estadísticos de asimetría.

Estos miden tanto la inclinación de los datos así como su dispersión. Entre las medidas de asimetría más conocidos están el Coeficiente de Pearson y las medidas de Curtosis y Apuntamiento.

Mencionaremos sólo al Coeficiente de Pearson. Primer coeficiente: CA = 3(Media - Mediana ) / s

Mide la razón entre a media y la mediana y la desviación estándar.

Segundo coeficiente: CA = (Q1 + Q3 - 2 Mediana) / (Q3 - Q1)

Ambos coeficientes pretender decirnos si los datos están sesgados respecto a su valor central.

Si CA = 0 ==> Los datos son simétricos.

Si CA < 0 ==> Los datos se encuentran inclinados hacia la izquierda o están sesgados a la derecha; por el contrario, son sesgados a la derecha, si CA > 0.

Ejemplo 20

En el ejemplo que estamos comentando se ha obtenido el coeficiente de asimetría de cada grupo de datos en las celdas:

En E34 digite:

=3*(PROMEDIO(Acersa)-MEDIANA(Acersa))/DESVEST(Acersa)

En E35 digite:

=3*(PROMEDIO(Pocsa)-MEDIANA(Pocsa))/DESVEST(Pocsa)

Se puede apreciar que la asimetría de los jornales en ambos casos es negativa. Los datos presentan un sesgo hacia la izquierda; es decir, los trabajadores con jornales más bajos presentan dispersión, están más alejados del promedio.

En resumen:

Con los resultados obtenidos al calcular los estadísticos de posición o de tendencia central y los de dispersión, podemos conocer el comportamiento y variabilidad de los datos.

Si un gran porcentaje de los datos son inferiores al promedio tenderán a tener un coeficiente de asimetría negativo mientras que si la mayor cantidad de los datos están por encima de la media, el coeficiente de asimetría será positivo.

Ejemplo 21 (Demostrativo desarrollado en Excel)

High Quality es una institución dedicada a otorgar certificaciones de calidad ISO 9001 a empresas de bienes y servicios. La Real S.A. está en proceso de evaluación por esta institución y una de las tareas es medir la satisfacción del personal de la empresa mediante una prueba con escala de 0 a 100 puntos. Los 40 trabajadores que laboran en la sede principal obtuvieron las siguientes puntuaciones:

74 89 82 83 67 81 68 85 81 72

71 74 60 64 72 84 66 84 69 81

69 66 93 63 98 70 95 82 81 80

88 80 85 85 72 81 90 89 80 87

a) Obtenga una tabla de distribución de frecuencias e interpreta algunos valores de dicha tabla

b) ¿Cuáles son los dos valores entre los cuales se encuentra el 50% las calificaciones obtenidas por dichos trabajadores?

c) ¿Cuál es la máxima calificación obtenida por el 20% de los trabajadores con menos calificación?

d) ¿Cuál debería ser la mínima calificación de un trabajador para que se encuentre en el quinto superior?

e) Obtenga la calificación media y luego de compararlo con la mediana de las calificaciones, diga si las calificaciones presentan un sesgo y hacia dónde.

f) ¿Las calificaciones de los 40 trabajadores presentan cierto grado de homogeneidad?

g) ¿Cuál es la dispersión absoluta de las calificaciones de los trabajadores?

h) ¿Compare el valor del Rango y el rango intercuartílico y diga cuál de ellos proporciona una mejor interpretación?

i) Obtenga el grado de asimetría de las calificaciones e interpreta su valor.

Solución

Para resolver las preguntas por Excel, ingrese los datos a la primera columna colocando en A1: Puntaje. Luego debe darle el nombre Puntaje al rango A2:A41.

Ante todo, ingresamos los datos en la columna A, a partir de la celda A2. En A1 colocamos Calif como nombre de la variable puntuación obtenida por un trabajador. Haga que la columna tenga una amplitud de 7.71. Que el rango de datos se llame Calif. ¿Cómo? a) Procedimiento: Rango C9:I9; combinar celdas; usar borde de cuadro grueso. Ingresar el texto:

Tabla de distribución de frecuencias.

En C2 n = =Contar(Calif]
En C3 Min = =Min(Calif]
En C4 Máx = =Max(Calif]
En C5 Rango = =C4 - C3]
En C6 Nro intervalos = =Entero(1+3.32*Log10(C2)+0.5)
En C7 Amplitud = =C4/C5

En el rango C10:H10 ingrese:

  Linf    LSup    PtoMedio    fi    Fi    hi    Hi

Cálculo de los límites de cada intervalo

En D2: =Contar(Calif)

En D3: = Min(Calif)

En D4= =Max(Calif)

En D5: = D4-D3

En D6: =ENTERO(1+3.32*LOG(D2)+0.5)

En D7: =D5/D6

En C11: =Min(Calif)

En D11: =C11+D$7

En C12: =D11

En D12: =C12+D$7

Copiar el rango C12:D12 y pegarlo en el rango C13:D16

Cálculo del punto medio:

En E11: =(C11+D11)/2

Copiar esta fórmula y pegarlo en el rango E12:E16.

Haga que el punto medio tenga dos decimales.

Obtención de la frecuencia absoluta:

- Seleccionamos el rango F11:F16 y sin deshacer esta selección,

- Ingresamos la fórmula: =Frecuencia(Calif,D11:D16)+0.001.

Luego, teniendo presionadas las teclas [Ctrl]+ [SHIFT], presionamos [Enter].

Nota:

Le añadimos 0.001 a la fórmula de D16 para que la función frecuencia incluya al extremo superior del último intervalo. Cada uno de los intervalos esabierto por la derecha. Luego obtenemos la suma de las frecuencias en F17.

Cálculo de las otras frecuencias:

En G11: =F11; En H11: =F11/$F$17; En I11: =H11

En G12: =G11+F12; En H12: =F12/$F$17; En I12: =I11+H17

Copiar el rango G12:I12 y pegarlo en el rango G13:I16

La tabla es la siguiente:

Comentarios:

- Hubo 16 trabajadores de la empresa cuya puntuación estuvo entre 79 y 85.33.

- Del mismo modo, 32 trabajadores tuvieron una puntuación por debajo de 85.33

- A 25 trabajadores se les dio una calificación entre 79 y 91.67.

- El 40% de los trabajadores tuvieron una calificación inferior a 70.

La tabla se encuentra en el archivo Ej prob01.

b) El siguiente esquema muestra los dos valores que debemos hallar, entre los cuales se encuentra contenido el 50% de los datos.

Si en el centro hay 50%, los segmentos exteriores contienen 25% de datos cada uno; por tanto, se trata de obtener los valores del primer y tercer cuartil.

Primer cuartil:

El valor que se requiere para ubicar el intervalo donde se encuentra el primer cuartil es n/4; es decir 40/4 = 10. Usando la columna F, el intervalo es el segundo.

A=66.33+6.3333*(40/4-5)/9 = 69.8485

En Excel:

Se deberá usar la función Percentil(RangoDeDatos,k) donde k debe estar expresado en porcentaje. Si se desea el percentil 20, k = 0.20.

Para obtener el primer cuartil:

=Percentil(Puntaje,0.25)  = 70.75

Tercer cuartil:

En este caso ubicaremos 3n/4 = 3(40)/4 = 30 usando la frecuencia acumulada. Esto indica que el intervalo donde se encuentra el tercer cuartil es el cuarto; luego

B=79.00+6.3333(30-16)/16 = 84.5416

En Excel:

=Percentil(Puntaje,0.75)  = 85

c) El 20% de los trabajadores con menor calificación indica que debemos hallar el percentil 20.

Esto significa que debemos ubicar primero el intervalo donde se encuentra dicho valor. Puesto que 20n/100 = 20(40)/100 = 8, entonces el percentil 20 se encuentra en el segundo intervalo. Por ello, P20 =66.33+6.3333(8-5)/9 = 68.44

Esto significa que el 20% de los trabajadores tuvieron una puntuación por debajo de 68.44; consecuentemente, la puntuación mínima del 80% de los trabajadores fue de 68.44.

En Excel:

=Percentil(Puntaje,0.20)  = 69

d) Contrario a la pregunta anterior, debemos obtener el percentil 80, ya que al 20% superior, le corresponde el 80% de los valores acumulados hasta el valor de dicho percentil. De manera que, puesto que 80(40)/100 = 32, cae en el cuarto intervalo, y esto indica que, el 80% de los datos alcanzan un valor máximo de 32; diremos que ésta es la mínima calificación del 20% de los trabajadores.

P80 = 79.0+6.3333(32-16)/16 = 85.33

Resuelto por Excel:

=Percentil(Puntaje,0.80) = 85.4

e) La solución a esta pregunta la daremos hallando primero el promedio y mediana. Cálculo del promedio: Usando los resultados en Excel (archivo Ej prob01)

Promedio =  =   (SUMAPRODUCTO(E11:E16,F11:F16))/(SUMA(F11:F16)) = 78.368

Cálculo de la mediana: Usando la tabla mostrada líneas arriba,

Me=79.0+6.3333(20-16)/16=80.5833

En consecuencia, las calificaciones de los trabajadores presentan una asimetría negativa y están sesgadas a la izquierda.

En Excel:

=Mediana(Puntaje) ==> 81

f) Para responder a esta pregunta debemos hallar el coeficiente de variación; y para calcularlo necesitamos obtener primero la varianza en datos agrupados.

Cálculo de la varianza:

Usando el archivo Ej prob01, s²= (SumaProducto(E11:E16,E11:E16,F11:F16)-40(78.368²))/(40-1)=88.0285754

De donde s = 9.38235447

Finalmente CV(X)= 9.38235447/78.368=0.11972175

Puesto que las calificaciones presentan una variabilidad del 11.97%, diremos que son homogéneas.

Resuelto en Excel

=Var(Puntaje)  = 89.025

g) La dispersión absoluta se mide utilizando la desviación estándar. Puesto que la desviación estándar es 9.383, entonces diremos que las calificaciones presentan una dispersión de 9.383 respecto de la calificación promedio.

En Excel:

=DesvEst(Puntaje)  = 9.435306

h) Según los resultados obtenidos en el libro mencionado,

Rango = 38

RIQ = Rango inercuartílico = Q3 – Q1 = B – A = 84.5416 – 69.8485 = 14.6931 Ambos indicadores son complementarios. Mientras el rango nos indica la dispersión que hay entre la mínima y máxima calificación, el rango intercuartílico nos indica qué tan dispersos están el 50% de las calificaciones centrales.

i) Calcularemos el coeficiente de asimetría.

Esto es, CA= (3(Media-Mediana))/s=(3(78.3667-80.5833))/9.383=-0.7087

Esto refuerza a una conclusión anterior (g); es decir, presentan un grado de asimetría negativo.

En Excel

=Coeficiente.Asimetria(Puntaje) = -0.064944

Pág. 2.25

Atrás  Inicio  Adelante





Página inicial  Cursos Informática Gratuitos

Síguenos en:   Facebook       Sobre aulaClic            Política de Cookies