La recta de los mínimos cuadrados con Excel y GeoGebra
{ ?x { ¯ ¯ LA RECTA DE LOS MÍNIMOS CUADRADOS
Autor: Mario Suárez Se llama línea de mejor ajuste
y se define como la línea que hace mínima la suma
de los cuadrados de las desviaciones respecto a ella de todos los
puntos que corresponden a la información recogida. La
recta de los mínimos cuadrados que aproxima el conjunto de
puntos (??1 , ??1 ), (??2 , ??2 ), (??3 , ??3 ), …
… (???? , ???? ) tomando en cuenta a Y como variable
dependiente tiene por ecuación ?? = ??0 + ??1 ?? A esta
ecuación suele llamarse recta de regresión de ??
sobre ??, y se usa para estimar los valores de ?? para valores
dados de ?? Si a la recta de regresión ?? = ??0 + ??1 ??
se le suma en ambos lados ? ?? = ?(??0 + ??1 ??) se obtiene ? ??
= ??0 ?? + ??1 ? ?? Si a la recta de regresión ?? = ??0 +
??1 ?? se multiplica por ?? a ambos lados y luego se suma ? ?? ??
= ? ??(??0 + ??1 ??) se obtiene ? ?? ?? = ??0 ? ?? + ??1 ? ??2
Las constantes ??0 ?? ??1 quedan fijadas al resolver
simultáneamente las ecuaciones anteriormente encontradas,
es decir, al resolver el siguiente sistema de ecuaciones: S?? =
??0 ?? + ??1 S?? S???? = ??0 S?? + ??1 S??2 Que se llaman las
ecuaciones normales para la recta de mínimos cuadrados.
Las constantes a0 y a1 de las anteriores ecuaciones
también se pueden calcular empleando las siguientes
fórmulas: ??0 = ? ?? · ? ??2 – ? ?? · ? ????
?? ? ??2 – (? ??)2 ??1 = ?? ? ???? – ? ?? · ? ?? ?? ? ??2
– (? ??)2 Otra ecuación para los mínimos cuadrados
para ?? = ?? – ?? , ?? = ?? – ?? de la recta de regresión
de Y sobre X es: ? ???? ?? = ( 2 ) ?? La recta de los
mínimos cuadrados que aproxima el conjunto de puntos (??1
, ??1 ), (??2 , ??2 ), (??3 , ??3 ), … … (???? ,
???? ) tomando en cuenta a X como variable dependiente tiene por
ecuación: ?? = ??0 + ??1 ?? A esta ecuación suele
llamarse recta de regresión de X sobre Y, y se usa para
estimar los valores de X para valores dados de Y. Las constantes
??0 y ??1 quedan fijadas al resolver el siguiente sistema de
ecuaciones: S?? = ??0 ?? + ??1 S?? S???? = ??0 S?? + ??1 S??2 Las
constantes ??0 y ??1 del sistema de ecuaciones anterior se pueden
calcular empleando las siguientes fórmulas:
¯ ¯ ¯ ¯ { ?x { ??0 = ? ?? · ? ??2 – ?
?? · ? ???? ?? ? ??2 – (? ??)2 ??1 = ?? ? ???? – ? ??
· ? ?? ?? ? ??2 – (? ??)2 Otra ecuación para los
mínimos cuadrados para ?? = ?? – ?? , ?? = ?? – ?? es: ??
= ( ? ???? ? y2 ) ?? El punto de intersección entre las
rectas ?? = ??0 + ??1 ?? con ?? = ??0 + ??1 ?? se simboliza (??,
??) y se llama centroide o centro de gravedad Ejemplo ilustrativo
Con los datos de la siguiente tabla sobre la altura en
centímetros (X) y los pesos en kilogramos (Y) de una
muestra de 8 estudiantes varones tomada al azar del segundo
semestre de una universidad. X 152 157 162 167 173 178 182 188 Y
56 61 67 72 70 72 83 92 1) Ajustar la recta de mínimos
cuadrados para Y como variable dependiente resolviendo el
sistema: S?? = ??0 ?? + ??1 S?? S???? = ??0 S?? + ??1 S??2 2)
Ajustar la recta de mínimos cuadrados para Y como variable
dependiente empleando las fórmulas: ??0 = ? ?? · ?
??2 – ? ?? · ? ???? ?? ? ??2 – (? ??)2 ??1 = ?? ? ???? – ?
?? · ? ?? ?? ? ??2 – (? ??)2 3) Ajustar la recta de
mínimos cuadrados para Y como variable dependiente
empleando la fórmula: ? ???? ?? = ( 2 ) ?? 4) Ajustar la
recta de mínimos cuadrados para X como variable
dependiente resolviendo el sistema: S?? = ??0 ?? + ??1 S?? S????
= ??0 S?? + ??1 S??2 5) Calcular el punto centroide. 6) Elaborar
el diagrama de dispersión. Y en el mismo diagrama graficar
las dos rectas de mínimos cuadrados obtenidas en los pasos
anteriores. 7) Estimar el valor de Y cuando X = 200 en el
diagrama de dispersión de Y como variable dependiente.
8,2
2 2 { = = = | | = = = 8) Estimar el valor de X cuando Y= 100 en
el diagrama de dispersión X como variable dependiente.
Solución: Se llena la siguiente tabla: ?? 152 157 162 167
173 178 182 188 ?? 56 61 67 72 70 72 83 92 ???? 8512 9577 10854
12024 12110 12816 15106 17296 ??2 23104 24649 26244 27889 29929
31684 33124 35344 ??2 3136 3721 4489 5184 4900 5184 6889 8464 S??
= 1359 S?? = 573 S???? = 98295 S?? = 231967 S?? = 41967 1)
Remplazando valores en el sistema se tiene: S?? = ??0 ?? + ??1
S?? S???? = ??0 S?? + ??1 S?? 573 = ??0 · 8 + ??1 ·
1359 8??0 + 1359??1 = 573 2 ? 98295 = ??0 · 1359 + ??1
· 231967 ? {1359??0 + 231967??1 = 98295 Resolviendo el
sistema por determinantes (regla de Cramer) se obtiene: ??0 = 573
1359 ???0 |98295 231967| 573 · 231967 – 98295 ·
1359 -665814 ? 8 1359 8 · 231967 – 1359 · 1359 8855
1359 231967 = -75,191 ??1 = 8 573 ???1 |1359 98295| 8 ·
98295 – 1359 · 573 7653 ? 8855 8855 8855 = 0,864 Para
calcular los valores de ??1 ?? ??0 en Excel se calcula de la
siguiente manera: a) Escribir los datos. Seleccionar las celdas
donde aparecerá la respuesta
b) Insertar la función ESTIMACION.LINEAL c) En la ventana
Argumentos de Función, en la casilla Conocido_y seleccione
los datos de Y, es decir, B2:B9 y en la casilla Conocido_x
seleccione los datos de X, es decir, A2:A9
d) Presione CTRL+SHIFT+ENTER Los cálculos en GeoGebra se
muestran en la siguiente figura: Remplazando valores en la
ecuación respectiva se obtiene: ?? = ??0 + ??1 ?? ? ?? =
-75,191 + 0,864?? Interpretación: – El valor ??1 = 0,864
indica que la recta tiene una pendiente positiva aumentando a
razón de 0,864 – El valor de ??0 = -75,191 indica el punto
en donde la recta interseca al eje Y cuanto X = 0 2) Con los
datos de la tabla anterior se substituye valores en las
siguientes ecuaciones: ??0 = ? ?? · ? ??2 – ? ?? ·
? ???? 573 · 231967 – 1359 · 98295 -665814 = = ?? ?
??2 – (? ??)2 8 · 231967 – (1359)2 8855 – 75,191 ??1 = ??
? ???? – ? ?? · ? ?? 8 · 98295 – 1359 · 573
7653 = = ?? ? ??2 – (? ??)2 8 · 231967 – (1359)2 8855 =
0,864 Remplazando valores en la ecuación respectiva se
obtiene: ?? = ??0 + ??1 ?? ? ?? = -75,191 + 0,864??
¯ ¯ ¯ ¯ ?x ¯ ¯ { 3) Se calcula las
medias aritméticas de X y Y para llenar la siguiente
tabla: ?? = 1359 8 = 169,875 ; ?? = 573 8 = 71,625 ?? 152 157 162
167 173 178 182 188 ?? 56 61 67 72 70 72 83 92 -17,88 -12,88
-7,875 -2,875 3,125 8,125 12,125 18,125 ?? = ?? – ?? ?? = ?? – ??
-15,625 -10,625 -4,625 0,375 -1,625 0,375 11,375 20,375 ????
279,297 136,797 36,422 -1,078 -5,078 3,047 137,922 369,297 ?? 2
319,516 165,766 62,016 8,266 9,766 66,016 147,016 328,516 ?? 2
244,141 112,891 21,391 0,141 2,641 0,141 129,391 415,141 S?? =
1359 S?? = 573 S???? = 956,625 S?? 2 = 1106,875 S?? 2 = 925,875
Remplazando valores en la fórmula respectiva se obtiene: ?
???? ?? = ( 2 ) ?? ? ?? = 956,625 1106,875 ?? ? ?? – ?? = 956,625
1106,875 (?? – ??) ?? – 71,625 = 956,625 1106,875 (?? – 169,875)
? 1106,875(?? – 71,625) = 956,625(?? – 169,875) 1106,875?? –
79280,20838 = 956,625?? – 162510,4984 1106,875?? = 956,625?? –
162510,4984 + 79280,20838 1106,875?? = 956,625?? – 83230,29 ?? =
956,625?? – 83230,29 1106,875 ? ?? = 956,625?? 83230,29 –
1106,875 1106,875 ? ?? = 0,864?? – 75,19 ?? = -75,19 + 0,864?? 4)
Remplazando valores en sistema respectivo se obtiene: S?? = ??0
?? + ??1 S?? S???? = ??0 S?? + ??1 S?? 1359 = ??0 · 8 +
??1 · 573 8??0 + 573??1 = 1359 2 ? 98295 = ??0 ·
573 + ??1 · 41967 ? 573??0 + 41967??1 = 98295 Resolviendo
el sistema se obtiene: ??0 = 95,871; ??1 = 1,033
{ ¯ ¯ ¯¯ Los cálculos en Excel se
muestran en la siguiente figura: Remplazando valores en la
ecuación de la recta de mínimos cuadrados se
obtiene: ?? = ??0 + ??1 ?? ? ?? = 95,871 + 1,033?? Los
cálculos en GeoGebra insertando Ajuste Lineal se muestran
en la siguiente figura: Interpretación: – El valor ??1 =
1,033 indica que la recta tiene una pendiente positiva aumentando
a razón de 1,033 – El valor de ??0 = 95,871 indica el
punto en donde la recta interseca al eje X cuanto Y = 0 5) Para
calcular el centroide (??, ??) se resuelve el sistema formado por
las dos rectas de los mínimos cuadrados en donde X es ?? y
Y es ??. ?? = -75,191 + 0,864?? ?? = 95,871 + 1,033?? Al resolver
el sistema se obtiene el centroide: X = 169,3 y Y = 71,092
6) En Excel, insertando gráfico de dispersión se
obtiene la siguiente figura: Empleando el programa Graph se
obtiene la siguiente figura: 7) Remplazando X = 200 en la
ecuación solicitada se obtiene: ?? = -75,191 + 0,864?? =
-75,191 + 0,864 · 200 = -75,191 + 172,8 = 97,609 8)
Remplazando Y = 100 en la ecuación solicitada se obtiene:
?? = 95,871 + 1,033?? = ?? = 95,871 + 1,033 · 100 = ?? =
95,871 + 103,3 = 199,171
{ ?x { ?y ¯ ¯ TAREA DE INTERAPRENDIZAJE 1) Consulte
sobre la biografía de Francis Galton y de Cramer, y
realice un organizador gráfico de cada una. 2) Dada la
siguiente tabla sobre la altura en centímetros (X) y los
pesos en kilogramos (Y) de una muestra de 8 estudiantes varones
tomada al azar del segundo semestre de una universidad. X 150 155
160 165 170 175 180 185 Y 55 60 63 67 70 74 79 85 2.1) Ajuste la
recta de mínimos cuadrados para Y como variable
dependiente resolviendo el siguiente sistema y empleando Excel y
GeoGebra. S?? = ??0 ?? + ??1 S?? S???? = ??0 S?? + ??1 S??2 ?? =
-66,869 + 0,812?? 2.2) Ajuste la recta de mínimos
cuadrados para Y como variable dependiente empleando las
fórmulas ??0 = ? ?? · ? ??2 – ? ?? · ? ????
?? ? ??2 – (? ??)2 ??1 = ?? ? ???? – ? ?? · ? ?? ?? ? ??2
– (? ??)2 ??0 = -66,869 ; ??1 = 0,812 2.3) Ajuste la recta de
mínimos cuadrados para Y como variable dependiente
empleando la fórmula ? ???? ?? = ( 2 ) ?? ?? = -66,869 +
0,812?? 2.4) Ajuste la recta de mínimos cuadrados para X
como variable dependiente resolviendo el siguiente sistema y
empleando Excel y GeoGebra. S?? = ??0 ?? + ??1 S?? S???? = ??0
S?? + ??1 S??2 ?? = 83,18 + 1,22?? 2.5) Ajuste la recta de
mínimos cuadrados para X como variable dependiente
empleando las fórmulas ??0 = ? ?? · ? ??2 – ? ??
· ? ???? ?? ? ??2 – (? ??)2 ??1 = ?? ? ???? – ? ??
· ? ?? ?? ? ??2 – (? ??)2 ??0 = 83.18 ; ??1 = 1,22 2.6)
Ajuste la recta de mínimos cuadrados para X como variable
dependiente empleando la fórmula ? ???? ?? = ( 2 ) ?? ?? =
83,18 + 1,22?? 2.7) Calcule el punto centroide. ?? = 170,9 ; ?? =
71,9 2.8) Calcule el coeficiente de determinación.
0,99
2.9) Elabore el diagrama de dispersión. Y en el mismo
diagrama graficar las dos rectas de mínimos cuadrados
obtenidas en los pasos anteriores. Elabore de manera manual,
empleando Excel y el programa Graph. 2.10) Estime el valor de Y
cuando X = 173 en el diagrama de dispersión de Y como
variable dependiente. 73,6 2.11) Estime el valor de X cuando Y =
73 en el diagrama de dispersión de Y como variable
dependiente. 172,2 3) Cree y resuelva un ejercicio similar al
anterior con datos obtenidos de 10 amigas suyas. 4) Consulte en
la biblioteca o en el internet sobre un ejercicio de
aplicación de la rectas de los mínimos cuadrados.
Presente ejercicio resuelto en forma manual y empleando Excel y
Graph.