Unidad 10. REGRESIÓN LINEAL (VII)

Análisis del modelo lineal general

En este caso la estimación de los parámetros de la regresión se deduce usando matrices:

Desde el punto de vista matricial, el modelo es Y = βX + ε , donde

El análisis de un modelo lineal múltiple se basa en todo lo dicho para el modelo lineal simple Y= β0 + β1 X1 + ε dejaremos de lado las deducciones tanto a nivel de estimación puntual, por intervalos como para las pruebas de hipótesis.

Nos dedicaremos a resolver modelos de más de dos variables mediante el programa Excel.

Prueba de hipótesis en el modelo lineal general

H0: β1 = β2 = … = βk = 0 : La variable Y no es ajustada por el modelo de regresión

H1: βi ≠ 0 para algún i = 1, 2,…, k: Una de las variables independientes contribuyen significativamente al modelo.

Estadístico de la prueba:

Como la tabla del ANOVA, nos proporciona este estadístico Entonces el estadístico de la prueba es

FC = CMR/CME

Valor crítico de la prueba:

En el caso general el número de grados de libertad de SSR es (k-1) por lo que los grados de libertad del numerador será (k-1) y del denominador, (n – k -1) Luego debemos hallar el valor crítico para F1-α (1,n-k-1)

Criterio de decisión

Si FC > F1-α (1,n-k-1) rechazaremos la hipótesis nula, con lo cual estaremos afirmando que el modelo no explica significativamente la variabilidad de la variable dependiente Y.

Prueba de hipótesis para βj:

H0: βj = 0 La variable Y no depende de la j-ésima variable independiente

H0: βj ≠ 0 La variable Y la j-ésima variable presentan alguna relación.

Estadístico de la prueba:

tC = βsjβs j )

Valor crítico:

En este caso los grados de libertad para t serán (n-k-1)

t1-α/2 (n-k-1)

Criterio de decisión:

Si tC > t1-α/2 (n-k-1) se rechazará la hipótesis nula; es decir, las variables aleatorias tienen un intercepto común en el origen de coordenadas.

Nota:

En los ejemplos que a continuación desarrollaremos, usaremos extensivamente todo los que el Excel nos proporciona como herramienta para resolver el problema.

Ejemplo 01

La gerencia de personal de una empresa desea elevar la eficiencia de sus empleados controlando el tiempo que tardan en el ensamble de celulares. Para ello somete a 10 de sus empleados a una prueba que consiste en registrar el tiempo de ensamble de un celular y someterlo a un riguroso control de calidad. El tiempo registrado por cada uno de ellos y la eficiencia alcanzada, se muestra en la siguiente tabla.

Tiempo (minutos) 27 45 41 19 35 39 19 49 15 31
Eficiencia(%) 47 84 80 46 62 72 52 87 37 68

a) Obtenga un diagrama de dispersión y diga a qué modelo se puede ajustar los datos. Identifique la variable independiente y la variable dependiente.

b) Calcule e interprete el valor de cada uno de los coeficientes de la recta de regresión

c) ¿Qué indica el valor del coeficiente de determinación?

Solución

a) Procedimiento:

- Ingresemos los datos al Excel a partir de A1 colocando como nombre de columna: Tiempo y Eficiencia. La variable Tiempo será la variable independiente y Eficiencia será la variable dependiente.

- Construiremos el diagrama de dispersión: Seleccionamos el rango A1:B11; usamos la secuencia [Insertar] - [desplegamos la lista de dispersión ] - seleccionamos “Dispersión solo con marcadores”

- Observando el gráfico podemos afirmar que existe una relación entre el tiempo que se tarda en ensamblar el celular y la eficiencia obtenida. Esta es una relación directa pues a mayor tiempo de ensamble mayor porcentaje de eficiencia.

- Vamos a añadir al gráfico Línea de tendencia. Estando seleccionado el gráfico - [Línea de tendencia ] - [Más opciones línea de tendencia]. En la ventana siguiente debe quedar activada Lineal, Presentar ecuación en el gráfico y Presentar el valor R cuadrado en el gráfico. Luego clic en [Cerrar].

- Podemos apreciar que el modelo es adecuado para explicar el comportamiento de la eficiencia en términos del tiempo de ensamble en el 91.5% de las veces. La ecuación de regresión estimada es:

Eficiencia = 18.06 + 1.42 Tiempo.

 Gracias al modelo podemos decir, si el tiempo de ensamble es de 20 minutos, el porcentaje de eficiencia alcanzado será de 18.06 + 1.42 (20) = 46.46%

- Estimaremos los coeficientes de regresión usando el Excel.

En este ejemplo no usaremos la función Estimacion.Lineal ni la herramienta Regresión.

- Como en D15 ingresamos la fórmula que calcula el coeficiente β1, entonces

=(D14*SUMAPRODUCTO(A2:A11,B2:B11)-SUMA(A2:A11)*SUMA(B2:B11))/(D14*SUMA.CUADRADOS(A2:A11)-SUMA(A2:A11)^2)

En D17 ingresamos la fórmula que calcula el intercepto β0:

=PROMEDIO(B2:B11)-D15*PROMEDIO(A2:A11)

 

Pág. 10.7

Atrás  Inicio  Adelante





Página inicial  Cursos Informática Gratuitos

Síguenos en:   Facebook       Sobre aulaClic            Política de Cookies