Unidad 2. ESTADíSTICA DESCRIPTIVA (XXII)

Ejemplo 18

El número de panes semanales que un grupo de 110 familias de una manzana consume en el desayuno se muestra en la siguiente tabla:

Número de latas Número de consumidores
[20 , 30 ) 25
[30 , 40 ) 20
[40 , 50 ) 35
[50 , 60 ) 15
[60 , 70 ) 15

a) ¿Más del 50% de los entrevistados tienen un consumo semanal de panes en el desayuno, superior al promedio? Fundamente su respuesta.

b) ¿Cuál es el número mínimo de panes adquiridos semanalmente para el desayuno por el 25% de familias que más panes adquieren?

c) ¿Cuál es el número máximo de panes semanales consumidas por el 15% de las familias que menos panes consumen?

d) ¿Cuál es el número de panes semanales consumido por el 50% de las familias?

e) ¿Cuál es el porcentaje de familias consumen panes por encima de 55 semanalmente?

Solución

Abra un libro vacío. Ingrese los datos en las columnas A, B y el número de consumidores (frec. absoluta) en la columna D, la cabecera puede tener el mismo formato de la hoja 1 del archivo Percentiles.xls. Calcule la columna del punto medio digitando en C2: =(A2+B2)/2; luego copie hacia las siguientes filas. A continuación obtenga la columna de la frecuencia acumulada digitando en E2: =D2. En E3 digite: =E2+D3. Luego copie hacia abajo.

a)

En B9 ingrese “Promedio = “. En B12 ingrese: “Mediana = “. En C9 ingrese =SumaProducto(C2:C6,D2:D6)/Suma(D2:D6) Calculemos la mediana: Como n/2 = 110/2 = 55 nos permite afirmar que la mediana se encuentra en el intervalo (40, 50), entonces Linf = 40; amplitud del intervalo = 10; Fj-1 = 45; fj = 35. Usando la fórmula de la mediana, ingresamos en C12: =A4+10*(110/2-E3)/D4.

Encontramos que el promedio es 42.727273 y la mediana es 42.857143. Puesto que el 50% de los datos están por encima del promedio, desde el promedio habrá más del 50% ya que su valor es inferior a la mediana. En consecuencia la respuesta es Sí.

b)

En este caso se pide encontrar el valor del percentil 25 o su equivalente, el primer cuartil. Puesto que n/4 = 25*n/100 = 27.5, entonces el intervalo al cual pertenece el primer cuartil o el percentil 25 es (30, 40). Esto implica que el LInf = 40; amplitud = 10; Fj-1 = 25 y fj = 25. Luego en B15 ingresamos: Primer cuartil; en C15, la fórmula: =A3+10*(110/4-E2)/D3.

Dejamos las siguientes dos preguntas como ejercicio.

Ejemplo 18: De generación de tabla de frecuencia y cálculo de estadísticos

Dado un conjunto de datos que se ingresa en una de las primeras columnas de una hoja de cálculo, obtener una tabla de frecuencias y los estadísticos principales.

Solución

Abra el archivo Generador de tabla frec.La extensión xlsm indica que se trata de un libro creado en la versión 2007 del Excel y que contiene macros. Sugerimos al lector que analice la codificación de esta macro y vea que muchas herramientas estadísticas podemos construirlas de la misma forma. Sólo requiere voluntad, ingenio y un poco de esfuerzo y dedicación.

Ingrese sus datos en la columna A, B o C de cualquiera de las hojas. Si hubiera datos en la columna elegida, bórrelos e ingrese los suyos. Haga clic en la imagen de la niñita. Cuando pida nombre de la hoja, digite el nombre de la hoja donde tiene sus datos. A continuación digite la columna donde ingresó sus datos; digite S si le puso nombre de columna (o cabecera) y finalmente, ingrese el número de intervalos que desea usar. Si desea usar la fórmula de Sturges, digite 0. En cada dato que ingrese, presione [Enter] o haga clic en [Aceptar]. Para terminar, pueden abrir los archivos:Gráfico con macros o     Ice calc v2

Y podrán encontrar en ellos lo que se puede hacer en Excel con macros y VBA.

Diagrama de Caja

Este es un tipo de gráfico que nos permite saber si en la muestra existe datos perdidos “data missing” así como la simetría de los datos y el sesgo que pudieran tener.

Para ello el gráfico presenta una caja tomando como lados extremos a los cuartiles primero y tercero. La mediana es un segmento vertical que divide a la caja no siempre en partes iguales. Es ella la que indica si los datos están distribuidos simétricamente o no.

Para conocer el diagrama de caja en un ejemplo y analizar su estructura, abra el archivo Graf 03, vaya a la hoja Diagrama de caja.

Comentario:

Si suponemos que los datos corresponden a una población de ingresos de 2156 trabajadores, podemos observar lo siguiente:

Los ingresos no son simétricos pues presentan cierto sesgo a la derecha. Esto lo apreciamos ya que el 50% de los empleados tienen ingresos superiores al promedio: Promedio = 2333.54 soles; Mediana = 2326.82 soles.

Los extremos del mayor rectángulo representan los ingresos mínimo y máximo de los datos. Esto quiere decir que, los ingresos de los trabajadores varían de un ingreso mínimo de 487.37 hasta 4414.95 con un rango de variación de 3927.58. En otras palabras, la dispersión de los ingresos, alrededor de la media, es de 655.07 soles.

La línea horizontal que une los extremos de dicho rectángulo representan los “bigotes”. Valores fuera de esta línea indicarían datos perdidos.

Pág. 2.22

Atrás  Inicio  Adelante





Página inicial  Cursos Informática Gratuitos

Síguenos en:   Facebook       Sobre aulaClic            Política de Cookies