Normalidad del modelo de regresión lineal

Normalidad
Información sobre la plantilla
Regresión lineal.jpg
Concepto:La normalidad es uno de los supuestos que se consideran en el modelo de Regresión Lineal Múltiple, consiste en que todas las muestras, tanto de las variables independientes así como de la variable dependiente, tienen que estar distribuidos normalmente, es dicir cumplir con la distribución normal también llamada distribución de Laplace-Gauss.

Normalidad consiste en que todas las muestras, tanto de las variables independientes así como de la variable dependiente, tienen que estar distribuidos normalmente, es dicir cumplir con la distribución normal.

Introducción

En la aplicación de los Mínimos Cuadrados Ordinarios para estimar el modelo clásico de regresiónlineal no se requiere de ningín supuesto acerca de la distribución de probabilidadde los residuos.

Ahora bién, para hacer inferencia estadística necesitamos que se cumpla el siguiente supuesto: las perturbaciones siguen una distribución normal.
este supuesto es necesario solamente para llevar a cabo inferencia, no para efectos de estimación.

Normalidad

Para cada valor de la variable independiente (o combinación de valores de las variables independientes), los residuos se distribuyen normalmente con media cero.

Esto se refiere a que todos nuestros datos, tanto nuestras variables independientes así como nuestra variable dependiente, tienen que tener puntajes que están distribuidos normalmente. Más específicamente los residuos (error) de estos puntajes deben tener una distribución normal. ¿Por qué es importante esto? La regresión es un análisis lineal y por ello, trabaja con relaciones lineales. Cuando los errores de las variables tienen distribución no normal, pueden afectar las relaciones y la significancia

Se supone que cada observación viene de una distribución normal centrada verticalmente en cada nivel (xi) del modelo asumido. (σ2) se asume igual para cada distribución normal Y|X=x∼N(xβ,σ2)ˆβ∼N(β,σ2(X′X)−1)

La normalidad de los errores permite la estimación por intervalos de confianza no sólo para los coeficientes de regresión, sino también para la predicción. Permite el planteamiento de pruebas de hipótesis sobre los parámetros del modelo. Cuando los errores no son normales, los intervalos y las pruebas de hipótesis no son exactas y pueden llegar a ser inválidas.


Fuentes