Regresión Lineal Múltiple
Diseño Experimental
2024-10-03
Regresión Lineal Múltiple
Modelos
Modelo Lineal
\[y = b + mx \\\]
Modelo Lineal (Estadística)
\[y = \beta_0 + \beta_1X_i + \epsilon \\
\hat{y} = \hat{\beta_0} + \hat{\beta_1}X_i + \hat{\epsilon}\]
Modelo Lineal Múltiple
\[\hat{y} = \hat{\beta_0} + \hat{\beta_1}X_{i1} + \hat{\beta_2}X_{i2} + ... + \hat{\beta_{p-1}}X_{i_{(p-1)}} + \hat{\epsilon}\]
Aproximación matricial
- Estimación por mínimos cuadrados:
\[\beta = (X^TX)^{-1}X^Ty\]
Hiperplano
Supuestos matemáticos
- Normalidad
- Homocedasticidad
- Indepedencia
- Linealidad
Predictores numéricos
Predictores categóricos
Multicolinealidad
Detección de multicolinealidad
- ¿Cómo detectarla o inferirla?
- Matriz de correlación
- Pruebas estadísticas (Factor Inflacionario de Varianza - VIF)
- Valores de VIF mayores a 5 o 10 son indicios de sesgo en la estimación de los coeficientes.
\[VIF = \frac{1}{1-R^2_p}\]
Selección de variables
Métodos de selección
- ¿Cómo comparar modelos?
- RMSE
- Criterios de información estadística:
- \(LogLik\): logaritmo de la verosimilitud
- \(AIC = -2 \times logLik + k + n\)
- \(BIC = AIC,\ con\ k = log(n)\)