- Coeficiente de
determinación - Una interpretación
intuitiva de r² - Coeficiente de
correlación - Desarrollo
en Minitab - Diagrama
de dispersión - Línea
de regresión y ecuación de
regresión - Desarrollo
de un Caso - Bibliografía
Este manual contiene
el concepto,
aplicación y ejecución en el sistema Minitab
versión 15, del tema de
Correlación.
Correlación
El objetivo de
esta sesión es analizar el grado de la relación
existente entre variables
utilizando modelos
matemáticos y representaciones gráficas. Así pues, para representar
la relación entre dos o más variables
desarrollaremos una ecuación que permitirá estimar
una variable en función de
la otra.
Por ejemplo:
- ¿En qué medida, un aumento de los
gastos en
publicidad hace
aumentar las ventas de un
determinado producto?
- ¿Cómo representamos que la bajada de
temperaturas implica un aumento del consumo de
la calefacción?
A continuación, estudiaremos dicho grado de
relación entre dos variables en lo que llamaremos
análisis de correlación.
Análisis de correlación:
Es la herramienta estadística que podemos usar para describir
el grado hasta el cual una variable está linealmente
relacionada con otra.
Mide el grado de asociación entre 2
variables.
Los estadísticos han desarrollado dos medidas
para describir la correlación entre 2
variables:
a) El coeficiente de
determinación.
b) El coeficiente de
correlación.
La introducción de estas dos medidas es el
propósito de esta sección.
Coeficiente de
determinación.
Es la principal forma en que podemos medir la
extensión o fuerza de la
asociación que existe entre 2 variables, X y Y.
Como hemos usado una muestra de puntos
para desarrollar líneas de regresión, nos
referiremos a esta medida como el coeficiente de
determinación de muestra.
Se desarrolla de la relación entre 2 tipos de
variación:
La variación de los valores Y
en un conjunto de datos alrededor
de:
- La línea de regresión ajustada =
Σ(Y-Y)²
- Su propia media =
Σ(Y-Y)²
El coeficiente de determinación se
simboliza:
Una interpretación intuitiva de
r²
Revisaremos las 2 formas extremas en las que las
variables X y Y pueden relacionarse. En este ejemplo cada
valor
observado de Y cae en la línea de estimación, como
se ve en la tabla esta es una correlación
perfecta.
La ecuación de estimación apropiada para
este caso es fácil de determinar. Puesto que la
línea de regresión pasa a través del origen,
sabemos que la intersección Y es cero; y puesto que Y se
incrementa en 4 cada vez que X se incrementa en 1, la pendiente
debe ser igual a 4.
La línea de regresión es:
Para determinar el coeficiente de determinación
de muestra para la línea de regresión, primero
calculamos el numerador de la fracción en la
ecuación de r².
Variación de los valores de Y
alrededor de la línea de regresión =
Como cada valor de Y está sobre la línea
de regresión la diferencia es 0
Σ(0)² = 0
Sustituimos los valores en la fórmula encontramos
que el coeficiente de determinación de muestra es igual
a + 1
Página siguiente |