- Introducción
A
continuación, desarrollare el grado de relación
entre dos o mas variables
en lo que llamaremos análisis de
correlación, Para representar esta
relación utilizaremos una representación
gráfica llamada diagrama de
dispersión, estudiaremos un modelo
matemático para estimar el valor de
una variable basándonos en el valor de otra, en lo que
llamaremos análisis de regresión.
y, finalmente Desarrollaremos un ejercicio aplicando lo
aprendido, donde utilizaremos datos
verdaderos de una empresa
de servicios
turísticos.Ecuación de regresión
Múltiple.- La forma general de la
ecuación de regresión múltiple con dos
variables independientes es:Y' = a +
b1X1 +
b2X2X1,X2 :
Variables Independientesa : es la ordenada del punto de
intersección con el eje Y.
b1 : Coeficiente de Regresión (es la
variación neta en Y por cada unidad devariación en X1.).
b2 : Coeficiente de Regresión (es el
cambio
neto en Y para cada cambiounitario en X2).
Prueba Global.- esta prueba investiga
básicamente si es posible que todas las variables
independientes tengan coeficientes de regresión neta
iguales a 0. - Marco Teórico
A fin de
facilitar la comprensión del presente trabajo
definiremos algunos conceptos basicos.
Análisis de Correlación
.- Es el conjunto de técnicas estadísticas empleado para medir la
intensidad de la asociación entre dos variables.
El principal objetivo
del análisis de correlación consiste
en determinar que tan intensa es la relación entre dos
variables. Normalmente, el primer paso es mostrar los datos
en un diagrama
de dispersión.
Diagrama de
Dispersión.- es aquel
grafico que representa la relación entre dos
variables.
Variable Dependiente.- es la variable
que se predice o calcula. Cuya representación es
"Y"
Variable Independiente.- es la variable
que proporciona las bases para el calculo. Cuya
representación es:
X1,X2,X3…….
Coeficiente de Correlación.-
Describe la intensidad de la relación entre dos
conjuntos
de variables de nivel de intervalo. Es la medida de la
intensidad de la relación lineal entre dos
variables.
El valor del coeficiente de correlación puede tomar
valores
desde menos uno hasta uno, indicando que mientras más
cercano a uno sea el valor del coeficiente de
correlación, en cualquier dirección, más fuerte
será la asociación lineal entre las dos
variables. Mientras más cercano a cero sea el
coeficiente de correlación indicará que
más débil es la asociación entre ambas
variables. Si es igual a cero se concluirá que no
existe relación lineal alguna entre ambas
variables.
Análisis de regresión.- Es
la técnica empleada para desarrollar la
ecuación y dar las estimaciones.
Ecuación de Regresión.- es
una ecuación que define la relación lineal
entre dos variables.
Ecuación de regresión Lineal: Y’ = a + Bx
Ecuación de regresión Lineal Múltiple:
Y’ = a + b1X1 +
b2X2 +
b3X3…
Principio de Mínimos Cuadrados.-
Es la técnica empleada para obtener la ecuación
de regresión, minimizando la suma de los cuadrados de
las distancias verticales entre los
valores verdaderos de "Y" y los valores pronosticados
"Y".
Análisis de regresión y
Correlación Múltiple.- consiste en
estimar una variable dependiente, utilizando dos o más
variables independientes.Y
X1
X2
AÑO
VENTAS
GASTOS DE
PUBLICIDADCOMISIONES
DE VENDEDORES2000
264000
550
15840
2001
384000
590
19250
2002
400200
680
26013
2003
422400
700
16896
2004
543000
750
16290
ANÁLISIS DE DATOS:
Se van a
utilizar las siguientes variables:
Variables Independientes:
1.- Gastos de
Publicidad2.- Comisión de vendedores
Variable dependiente:
–
VentasUtilizando el Excel
obtenemos los siguientes datos.Estadísticas de
la RegresiónCoeficiente de correlación
múltiple0.92092
Coeficiente de determinación
R20.84810
R2 ajustado
0.69619
Error típico
54887.83156
Observaciones
5
De aquí se puede decir:
– De acuerdo al valor del coeficiente de correlación
múltiple, podemos afirmar que la variable
X1 (Gastos de Publicidad) y X2
(Comisión de vendedores) se encuentran asociadas en
forma directa de una manera muy fuerte con la variable
dependiente Ventas, en un 92%.
– De acuerdo al Coeficiente de determinación
R2, podemos decir que el 85% de las ventas pueden
ser explicadas por los gastos de publicidad y las comisiones
de los vendedores.A N Á L I S I S D E
V A R I A N Z AGrados de
libertadSuma de
cuadradosProm. de los
cuadradosF
Valor crítico de
FRegresión
2
33640459893
16820229947
5.5832
0.15190282
Residuos
2
6025348107
3012674053
Total
4
39665808000
Coeficientes
Error
típicoEstadístico
tProbab.
Inf.
95%Sup.
95%Inferior
95.0%Sup.
95.0%Intercepción
-289315.16
242459.39
-1.193
0.35513
-1332534.446
753904.118
-1332534.446
753904.118
GSTOS DE PUBLICID.
1123.49
336.22
3.342
0.07908
-323.1275965
2570.108
-323.128
2570.108
COM. DE VENDED.
-2.27
6.55
-0.346
0.76245
-30.45400257
25.922
-30.454
25.922
De aquí se desprende la ecuación de
regresión múltiple:Y = – 289315 + 1123 X1 – 2.27
X2Prueba Global: Verificación de la
validez del modelo de regresión Múltiple.
Formulación de Hipótesis:
Hp: B1 = B2 = 0
Ha: B1 B2 0Si se acepta la hipótesis
planteada, significa que ninguno de los factores
(X1,X2) son relevantes para explicar
los cambios en Y.
De acuerdo a la tabla de análisis de la varianza
F calculado es 5.58 y el p-valor
es 0.15, de lo cual podemos decir que La
hipótesis planteada se rechaza y se acepta la
hipótesis alternativa, por que el F calculado
es mayor que el p-valor.
Hasta ahora se ha demostrado que algunos, pero no
necesariamente todos los coeficientes de regresión, no
son iguales a cero y, por o tanto son útiles para las
predicciones. El siguiente paso consiste en probar
individualmente las variables para determinar cuales
coeficientes de regresión pueden ser cero y cuales
no.
Del análisis mediante Excell tenemos el siguiente
cuadro.VENTAS VS GASTOS DE PUBLICIDAD
Estadísticas de la
regresiónCoeficiente de correlación
múltiple0.915976333
Coeficiente de determinación
R^20.839012642
R^2 ajustado
0.785350189
Error típico
46136.36902
Observaciones
5
A N Á L I S I S D E
V A R I A N Z AGL
Suma de
cuadradosProm. de los
cuadr.F
p-Valor
Regresión
1
33280114360
33280114360
15.6350
0.028865932
Residuos
3
6385693640
2128564547
Total
4
39665808000
Coeficientes
Error
típicoEstadíst. t
Probab.
Inf.
95%Sup.
95%Inf.
95%Sup.
95%Intercepción
-324444.428
185054.64
-1.7532
0.1778
-913371.43
264482.58
-913371.43
264482.58
GASTOS DE PUBLICIDAD
1111.8722
281.19389
3.9541
0.0289
216.9869
2006.7575
216.9869
2006.7575
VENTAS VS COMISIÓN DE VENDEDORES
Estadísticas de la
regresiónCoeficiente de correlación
múltiple0.003317293
Coeficiente de determinación
R^21.10044E-05
R^2 ajustado
-0.333318661
Error típico
114986.0448
Observaciones
5
ANÁLISIS DE VARIANZA
GL
Suma de
cuadradosProm. de los
cuadradosF
Valor crítico de
FRegresión
1
436499.6307
436499.6307
3.30137E-05
0.9957763
Residuos
3
39665371500
13221790500
Total
4
39665808000
Coeficientes
Error
típicoEstadíst. t
Probabilidad
Inferior
95%Superior
95%Inferior
95.0%Superior
95.0%Intercepción
404199.6521
262605.1563
1.539191605
0.22138434
-431527.9414
1239927.246
-431527.9414
1239927.246
COM. DE VENDEDORES
-0.07846366
13.65594537
-0.00574575
0.9957763
-43.53781731
43.38088999
-43.53781731
43.38088999
De acuerdo a los cuadros podemos decir:
– La variable que mas relación tiene con las Variable
Dependiente es decir las ventases la variable Gastos de Publicidad ya que su R2
"Coeficiente de determinación" es79%.
– En cuanto a la variable Comisiones de vendedores podemos
decir que no tienerelación relevante con las Ventas ya que su
Coeficiente de determinación es casinulo 0.001% .
- Desarrollo
de un Caso.
Una agencia de Viajes desea
saber la relación que hay entre las ventas, el
presupuesto
destinado a publicidad, y
las comisiones de los vendedores para esto presenta los
siguientes datos. Realice los análisis
respectivos. - Bibliografía.
a) LIND, Douglas y MARCHAL, William y MASON, Robert.
Estadística para administración y economia.
Alfaomega. Colombia
11ava edición. 2004 Cap.13 y 14
b) CORDOVA, Jorge Herramientas Estadísticas
para la Gestión en Salud. JC ediciones.
Versión electrónica (formato CD) Mayo
2003.
c) HILDEBRAND, David y OTT, Lyman.
Estadística Aplicada a la administración y a la economia.
Adidison wesley Iberoamericana sa. 1997. Cap. 13,14 y
15.
Ing. Sandra Ysolina Baca Garcia
UNIVERSIDAD INCA
GARCILASO DE LA VEGA
ESCUELA DE
POSTGRADO
"MAESTRÍA EN CIENCIAS EN
INGENIERÍA DE SISTEMAS Y
COMPUTACIÓN"
Lima, Noviembre del 2005
CURSO : Modelos
Estadísticos