Supuestos del modelo de regresión lineal

Como todo modelo estadístico, el análisis de regresión lineal, parte del cumplimiento de un conjunto de supuestos necesarios, para  validar su confiabilidad.

Esto supuestos o condiciones, constituyen la base teórica del análisis, por lo que su incumplimiento, impide su ejecución de forma tacita.

Esto quiere decir que antes de intentar aplicar el modelo de regresión lineal, a nuestros datos, es necesario examinar los supuestos que lo condicionan.

En algunos de estos , como en los de independencia, homocedasticidad y normalidad, estrechamente relacionados con los residuos, nos será de mucha ayuda observar en detalle, el comportamientos de estos.

Los supuestos son:

Independencia.

Los residuos son independientes entre sí, es decir, los residuos constituyen una variable aleatoria.

Cuando se trabaja con series temporales, podemos hallar residuos autocorrelacionados entre sí.

Linealidad.

La ecuación de regresión, posee una forma particular que responde a una recta. A partir de ello, se dan como característica que la variable dependiente constituye la suma de un conjunto de elementos que son: el origen de la recta, una combinación lineal de variables independientes o predictoras y los residuos.

Este  supuesto puede incumplirse por varias causas, como por ejemplo la no linealidad (la relación entre las variables independientes y la dependiente no es lineal), la no aditividad (el efecto de alguna variable independiente es sensible a los niveles de alguna otra variable independiente), la omisión de variables independientes  que son importantes para el estudio, la  inclusión de variables independientes irrelevantes,  parámetros cambiantes (los parámetros no permanecen constantes durante el tiempo que dura la recogida de datos), entre otros.

 A este incumplimiento se le denomina error de especificación y es fácilmente predecible observando el diagrama de dispersión.

También el uso de gráficos parciales, ayudará a observar la linealidad entre las variables,  al ser herramientas que ofrecen una representación espacial, de la relación neta entre dos variables.

Homocedasticidad.

Para cada valor de la variable independiente (o combinación de sus valores), la varianza de los residuos es constante.

Normalidad.

Para cada valor de la variable independiente (o combinación de sus valores), los residuos se distribuyen normalmente con media cero.

No-colinealidad.

No existe relación lineal exacta entre ninguna de las variables independientes.

El incumplimiento de este supuesto da origen a colinealidad o multicolinealidad en dependencia de las variables que afecte.

La no-colinealidad, no tiene  por supuesto sentido en  el análisis de regresión simple,  ya que para su análisis es necesaria la existencia de más de una variable independiente.

Espero modestamente que este artículo, sirva de ayuda a alguien.

Gracias

Puedo absorber tus pecados, pero no vivir tu vida.

Y