Forma matricial del modelo
Habitualmente escribimos el modelo como
Y = Xb + U
con:
Método de Mínimos Cuadrados
Valor observado
Dato (y)
Recta de regresión
estimada
Valor observado
Dato (y)
Recta de regresión
estimada
Mínimos Cuadrados
Objetivo: Buscar los valores de b0,b1,
,bk que mejor ajustan nuestros datos.
Ecuación:
Residuo:
Minimizar:
Mínimos Cuadrados
Resultado en forma matricial:
Interpretación geométrica
Hemos calculado:
Tenemos:
Definimos la matriz:
H es idempotente, simétrica y del mismo rango
que X, (k+1). Es una matriz de proyección.
Interpretación geométrica
H simétrica (obvio)
H idempotente
Residuos ortogonales a valores ajustados
Residuos ortogonales a matriz de diseño X
Interpretación geométrica
Subespacio vectorial generado por las columnas de X
Varianza
Para estimar s2 utilizamos la varianza residual
Es insesgado como estimador de s2 y además
Propiedades de los estimadores
Normalidad. Sabemos Y=Xb +U, de donde Y~N(Xb,s2I).
Como también es normal.
Esperanza.
Varianza.
Propiedades de los estimadores
Tenemos
La varianza s2 suele ser desconocida y utilizamos
el error estándar estimado
Inferencia. Contrastes para b
Para averiguar si la variable xi afecta a la
respuesta, debemos plantear el contraste
Rechazamos la hipótesis nula si:
Inferencia. Int. de confianza para b
Podemos construir un intervalo de confianza
para bi con nivel de confianza 1-a como
Si n > 30 y a = 0.05, sabemos que tn-k-1,a/2 @ 2.
Descomposición de la variabilidad
Igual que en la regresión simple VT=VE+VNE
Coeficiente de determinación
El coeficiente de determinación se define:
El coeficiente de determinación ajustado es más interesante ya que sólo aumenta si disminuye la varianza residual
Contraste de regresión (fuera programa)
Para averiguar si existe relación lineal entre la
variable respuesta y las explicativas, realizamos
Rechazamos la hipótesis nula si:
Predicción para la media
Buscamos estimador puntual e I.C. para el valor medio de la respuesta cuando x=x0
Predicción para la media
El intervalo de confianza para la media que obtenemos es:
Ejemplo: semiconductores
¿Cuál sería el I.C. para para la respuesta media si la longitud del cable es 8 y la altura de la estructura es 275?
Ejemplo: semiconductores
Predicción para una nueva observación
Intervalo de predicción
Ejemplo: semiconductores (long. 8, altura 275)
Multicolinealidad
Problema frecuente que se presenta cuando las variables explicativas son muy dependientes entre sí.
No es un problema del modelo, sino de los datos, surge cuando det(XtX) próximo a cero.
Las variables explicativas son significativas en el modelo simple, pero dejan de serlo en el múltiple.
Índice de condicionamiento
Los autovalores de XtX son mayores o iguales que cero, para que haya multicolinealidad, alguno tiene que ser aproximadamente cero.
Si 10 £ Ind.Cond. £ 30, multiolinealidad moderada
Si Ind.Cond. > 30, multicolinealidad alta
Ejemplo: Sabor del queso
Ejemplo: sabor del queso
Multicolinealidad moderada
Ejemplo: sabor del queso
Ejemplo: sabor del quesoRegresión simple Láctico
Antes 30.73
Ejemplo: sabor del quesoRegresión simple Acético
Antes 3.9
Página anterior | Volver al principio del trabajo | Página siguiente |