Unidad 10. REGRESIÓN LINEAL (I)

10.1 INTRODUCCIÓN

En los capítulos anteriores en varias ocasiones hemos hablado de más de una variable. Por ejemplo cuando hablamos de variables aleatorias bidimensionales, dijimos que dos variables aleatorias estarán relacionadas si su covarianza es diferente de 0.

Si la covarianza es positiva entonces existe una relación directa positiva; es decir, si una variable aumenta, entonces también aumenta la otra; por el contrario si la covarianza es negativa entonces existe relación inversa; lo que significa que cuando una aumenta, la otra disminuye. Por otro lado, si la covarianza es cero, dijimos que las dos variables no están relacionadas; es decir, son variables aleatorias independientes.

En la práctica existen muchos casos en los cuales dos o más variables aleatorias están relacionadas.

¿Qué significa que dos o más variables están relacionadas?

Significa que entre ellas existe una relación funcional de la forma y = f(x) en el caso de dos variables y cuando se tiene más de dos variables entonces el modelo será

y = f(x1, x2 , … , xn).

En esta caso tendremos el modelo en el cual la variable Y está en relación de X1, X2, … , Xn1; es decir, Y depende de los Xi.

Según esto, Y recibe el nombre de variable dependiente y X1, X2, … ,Xn constituyen las variables independientes.

Veamos el caso de la venta del pollo: Cuando la demanda del pollo aumenta, el precio también aumenta; sin embargo, cuando la oferta aumenta, el precio del pollo disminuye. Esto lo saben todas las amas de casa que diariamente hacen el mercado.

De manera que, si se desea analizar si dos o más variables están relacionadas, debemos obtener un modelo matemático que nos permita construir dicha relación.

Y ¿por qué tenemos que estudiar la relación entre dos variables? Si se tiene el modelo podemos realizar proyecciones futuras las que nos permitirá realizar una adecuada toma de decisiones.

Sin embargo, antes de construir el modelo matemático, debemos realizar un análisis de dispersión de las variables dos a dos; entre la variable dependiente y una de las variables independientes. La forma cómo se muestran los puntos en este gráfico nos indicará qué modelo construir.

En el presente capítulo estudiaremos el modelo lineal cuyo modelo matemático se representará como

 Y = β0 + β1 X1 + β2 X2 + … + βn Xn + ε

denominado modelo de regresión lineal múltiple.

Cuando se trata de un modelo de dos variables entonces tendremos Y = β0 + β1 X1 + ε denominado modelo de regresión lineal simple. En ambos modelos ε es una variable llamada variable estocástica que representará los errores que afectan a Y, pero que no son explicados por el modelo, el cual se sustenta en los siguientes supuestos:

E(ε ) = 0

V(ε) = σ2

Y que las variables ε1 no están correlacionadas.

Pág. 10.1

Atrás  Inicio  Adelante





Página inicial  Cursos Informática Gratuitos

Síguenos en:   Facebook       Sobre aulaClic            Política de Cookies