El rango de la distribución de frecuencias se calcula
así:
R= (lim. Sup. de la clase n
– lim. Inf. De la clase 1)
= (93.910 – 7.420) =
86.49
- Propiedades del Rango o
Recorrido:
- El recorrido es la medida de dispersión
más sencilla de calcular e interpretar puesto que
simplemente es la distancia entre los valores
extremos (máximo y mínimo) en una
distribución - Puesto que el recorrido se basa en los
valores extremos éste tiende s ser
errático. No es extraño que en una
distribución de datos
económicos o comerciales incluya a unos pocos valores
en extremo pequeños o grandes. Cuando tal cosa sucede,
entonces el recorrido solamente mide la dispersión con
respecto a esos valores anormales, ignorando a los
demás valores de la variable. - La principal desventaja del recorrido es que
sólo esta influenciado por los valores extremos,,
puesto que no cuenta con los demás valores de la
variable. Por tal razón, siempre existe el peligro de
que el recorrido ofrezca una descripción distorsionada de la
dispersión. - En el control de
la calidad se
hace un uso extenso del recorrido cuando la
distribución a utilizarse no la distorsionan y cuando
el ahorro del
tiempo al
hacer los cálculos es un factor de
importancia.
1.2.-
LA VARIANZA (S2 ó δ2
):
La varianza es una medida de dispersión relativa
a algún punto de referencia. Ese punto de referencia es la
media aritmética de la distribución. Más
específicamente, la varianza es una medida de que tan
cerca, o que tan lejos están los diferentes valores de su
propia media aritmética. Cuando más lejos
están las Xi de su propia media
aritmética, mayor es la varianza; cuando más cerca
estén las Xi a su media menos es la varianza. Y
se define y expresa matemáticamente de la siguiente
manera:
La varianza para datos no
agrupados
Dado un conjunto de observaciones, tales como
X1, X2, … , Xn, la
varianza denotada usualmente por la letra minúscula
griega δ (sigma) elevada al cuadrado
(δ2)y
en otros casos S2 según otros
analistas, se define como: el cuadrado
medio de las desviaciones con respecto a su media
aritmética"
Matemáticamente, se expresa como:
Ejemplo:
Se tienen las edades de cinco estudiantes
universitarios de Ier año, a saber: 18,23, 25, 27, y
34. Al calcular la media aritmética (promedio de las
edades, se obtuvo 25.4 años, encontrar la varianza de
las edades de estos estudiantes:
Para calcular se utiliza una tabla estadística de trabajo de
la siguiente manera:
Xi |
( Xi – | ( Xi – |
18 | (18 – 25.5)=-7.4 | (-7.4)2=54.76 |
23 | (23 – 25.5)=-2.4 | (-2.4)2= |
25 | (25 – 25.5)=-0.4 | (-0.4)2= |
27 | (27 – 25.5)= 1.6 | ( 1.64)2= |
34 | (34 – 25.5)= 8.6 | ( 8.6)2 |
Total | xxxx | 137.20 |
Respuesta: la varianza de las edades es de 27.4
años
La varianza para datos
agrupados
Si en una tabla de distribución de frecuencias.
Los puntos medios de
las clases son X1, X2, … ,
Xn; y las frecuencias de las clases f1,
f2, … , fn; la varianza se calcula
así:
Σ(Xi-)2f1
δ2
= —————-
Σfi
Sin embargo la formula anterior tiene
algún inconveniente para su uso en la practica, sobre
todo cuando se trabaja con números decimales o cuando la
media aritmética es un número entero. Asimismo
cuando se trabaja con máquinas
calculadoras, La tarea de computar la varianza se simplifica
utilizando la formula de computación que se da a
continuación:
ΣXi2fi
–
[(ΣXifi)2/N]
δ2 =
—————————-
N donde
N=Σfi
Ejemplo:
Se tienen los datos de una muestra de 30
cuentas por
cobrar de la tienda Cabrera’s y
Asociados dispuestos en una tabla de
distribución de frecuencias, a partir de los cuales se
deberá calcular la varianza, para lo cual se construye
la siguiente tabla estadística de trabajo, si se
calculó anteriormente la media aritmética y se
fijó en 43.458 (ver ejemplo del calculo en "media
aritmética para datos agrupados) de la siguiente
manera
clases | Punto Xi | fi | Xi2 | Xifi | X2fi |
7.420 – 21.835 | 14.628 | 10 | 213.978 | 146.280 | 2,139.780 |
21.835 – 36.250 | 29.043 | 4 | 843,496 | 116.172 | 3,373.984 |
36.250 – 50.665 | 43.458 | 5 | 1,888.598 | 217.270 | 9,442.990 |
50.665 – 65.080 | 57.873 | 3 | 3,349.284 | 173.619 | 10,047.852 |
65.080 – 79.495 | 72.288 | 3 | 5,225.555 | 216.864 | 15,676.665 |
79.495 – 93.910 | 86.703 | 5 | 7,533.025 | 433.965 | 37,665.125 |
Total | XXX | 30 | 19,053.936 | 1,304.190 | 78,346.396 |
= 21,649.344 / 30 = 721.645
Respuesta: la varianza de las cuentas por
cobrar es igual B/.721.645
- Propiedades de la varianza :
- s siempre un valor no
negativo, que puede ser igual o distinta de 0. Será 0
solamente cuando Xi= - La varianza es la medida de dispersión
cuadrática optima por ser la menor de
todas. - Si a todos los valores de la variable se le suma
una constante la varianza no se modifica.
Veámoslo:
Si a xi le sumamos una constante xi’ = xi + k
tendremos (sabiendo que )
- Si todos los valores de la variable se multiplican
por una constante la varianza queda multiplicada por el
cuadrado de dicha constante. Veámoslo:
Si a xi’ = xi · k tendremos (sabiendo que
)
- Si en una distribución obtenemos una serie
de subconjuntos disjuntos, la varianza de la
distribución inicial se relaciona con la varianza de
cada uno de los subconjuntos mediante la
expresión
Siendo
Ni è el nº
de elementos del subconjunto (i)
S2i è la
varianza del subconjunto (i)
1.3.- LA DESVIACIÓN ESTÁNDAR (S
ó δ)
Es una medida de la cantidad típica en la
que los valores del conjunto de datos difieren de la
media. Es la medida de dispersión más
utilizada, se le llama también desviación
típica. La desviación estándar siempre se
calcula con respecto a la media y es un mínimo cuando se
estima con respecto a este valor.
Se calcula de forma sencilla, si se conoce la varianza,
por cuanto que es la raíz cuadrada positiva de esta. A la
desviación se le representa por la letra minúscula
griega "sigma" ( δ ) ó por
la letra S mayúscula, según otros
analistas.
Cálculo de la
Desviación Estándar
δ =
√δ2 ó S =
√S2
Ejemplo:
Del calculo de la varianza de las
edades de cinco estudiantes universitarios de primer año
se obtuvo δ2=27.44, como la desviación
estándar es la raíz cuadrada positiva, entonces
δ = √27.44 = 5.29 años.
Igual procedimiento
se aplica para encontrar le desviación estándar
de las cuentas por cobrar de la Tienda Cabrera’s y
Asociados, recordemos que la varianza obtenida fue de 721.645,
luego entonces la desviación estándar es igual a
δ =√721.645 = 26.86 balboas.
- Propiedades de la Desviación
Estándar
A su vez la desviación estándar,
también tiene una serie de propiedades que se deducen
fácilmente de las de la varianza (ya que la
desviación típica es la raíz cuadrada
positiva de la varianza):
- La desviación estándar es siempre un
valor no negativo S será siempre ³ 0 por definición. Cuando S = 0
è X = xi (para todo
i). - Es la medida de dispersión óptima por
ser la más pequeña. - La desviación estándar toma en cuenta
las desviaciones de todos los valores de la
variable - Si a todos los valores de la variable se le suma
una misma constante la desviación estándar no
varía. - Si a todos los valores de la variable se
multiplican por una misma constante, la desviación
estándar queda multiplicada por el valor absoluto de
dicha constante.
1.4.- El Coeficiente de Variación de Pearson
(C.V.)
Las medidas de tendencia central tienen como objetivo el
sintetizar los datos en un valor representativo, las medidas de
dispersión nos dicen hasta que punto estas medidas de
tendencia central son representativas como síntesis
de la información. Las medidas de
dispersión cuantifican la separación, la
dispersión, la variabilidad de los valores de la
distribución respecto al valor central. Distinguimos entre
medidas de dispersión absolutas, que no son comparables
entre diferentes muestras y las relativas que nos
permitirán comparar varias muestras.
El problema de las medidas de dispersión
absolutas es que normalmente son un indicador que nos da problemas a la
hora de comparar. Comparar muestras de variables que
entre sí no tienen cantidades en las mismas unidades, de
ahí que en ocasiones se recurra a medidas de
dispersión relativas.
Un problema que se plantea, tanto la varianza como la
desviación estándar, especialmente a efectos de
comparaciones entre distribuciones, es el de la dependencia
respecto a las unidades de medida de la variable. Cuando se
quiere comparar el grado de dispersión de dos
distribuciones que no vienen dadas en las mismas unidades o que
las medias no son iguales se utiliza el llamado
"Coeficiente de Variación de Pearson", del
que se demuestra que nos da un número independiente de las
unidades de medidas empleadas, por lo que entre dos
distribuciones dadas diremos que posee menor dispersión
aquella cuyo coeficiente de variación sea menor., y que
se define como la relación por cociente entre la
desviación estándar y la media aritmética; o
en otras palabras es la desviación estándar
expresada como porcentaje de la media
aritmética.
Definición del Coeficiente
de Variación
Donde: C.V. representa el
número de veces que la desviación típica
contiene a la media aritmética y por lo tanto cuanto
mayor es CV mayor es la dispersión y menor la
representatividad de la media.
- Propiedades del Coeficiente de Variación
:
- Si a todos los valores de la variable se le suma
una misma constante el coeficiente de variación queda
alterado .
Ejemplo:
Suponga que Usted trabaja en una
compañía de ventas, que
ofrece como premio de incentivo al mejor vendedor del trimestre
anterior las entradas al palco empresarial en la serie final de
béisbol de las grandes ligas en los Estados Unidos
(E,E,U,A,).
De los registros de
ventas se tienen los siguientes datos de ventas, expresados en
porcentajes de cumplimiento de las metas fijadas
mensualmente:
Vendedor A 95 105 100
Vendedor B 100 90 110
El promedio trimestral de cumplimiento de las metas de
ventas de ambos vendedores es igual y equivale al 100%, pero
Ud. Sólo le puede dar el premio de incentivo a uno de
ellos. ¿Cuál usted escogería?. ¿En
base a que criterio’. Explique.
Este problema se resuelve utilizando el coeficiente de
variación, para estos efectos es necesario encontrar la
desviación estándar trimestral de las ventas de
cada uno de la siguiente manera:
Vendedor A
Xi | ( Xi – | ( Xi – |
95 | 95 – 100 = -5 | (-5)2 = 25 |
105 | 105 – 100 = 5 | ( 5)2 = 25 |
100 | 100 – 100 = 0 | ( 0)2 = 0 |
Total | XXX | 50 |
La desviación estándar es
δ=√(50/3) = √16.667 = 4.08, luego entonces el
coeficiente de variación es igual a:
δ 4.08
C.VA= ——— =
———– = 0.0408
100
Vendedor B
Xi | ( Xi – | ( Xi – |
100 | 100 – 100 = 0 | ( 0 )2 = 0 |
90 | 90 – 100 = -10 | (-10)2 = |
110 | 110 – 100 = 10 | ( 10)2 = |
Total | XXX | 200 |
La desviación estándar es
δ=√(200/3) = √66.667 = 8.16, luego entonces
el coeficiente de variación es igual a:
Respuesta: Dado que el vendedor A tiene menor
coeficiente de variación, A él le corresponde
recibir el premio de incentivo.
LABORATORIO
(Resolver y entregar en grupos de tres
estudiantes, equivalen a nota de un parcial)
Problema #1:Datos no agrupados
Calcule el rango, la varianza y la desviación
estándar de las observaciones que se presentan a
continuación.
63 45 39 55 69 21 50 25 33 25
Problema #2:
Un profesor hace
un examen a tres estudiantes y las puntuaciones resultantes
(Xi) son: 73, 75 y 77.
- Hallar la media, la varianza y la desviación
estándar de esta población de valores - En la clase hacia un calor
terrible, y hubo alarma por la amenaza de incendio durante el
examen. El profesor quisiera aumentar las puntuaciones para
tener en cuenta estas condiciones desafortunadas de
ambientación. Un primer aumento suma 10 puntos a cada
puntuación. Sea Yi = Xi+10.
Halle ,
δ2 y
δ. - Un segundo aumento incrementa cada puntuación
en un 10%. Sea Pi =1.1(Xi). Halle
,
δ2 y
δ. - El último aumento es una combinación de
los dos primeros. Est es, cada puntuación se incrementa
en un 10% y luego se suman 10 puntos más. Sea
Zi = 1.1(Xi)+10. Halle .
δ2 y
δ..
Problema #3:Datos Agrupados
La distribución de frecuencias que se presenta a
continuación muestra el tiempo que se necesita para
envolver 130 paquetes que fueron enviados por correo en
Macondo.
Calcule el rango, la varianza y la desviación
estándar de la siguiente distribución de
frecuencias de los datos:
Tiempo (en | No.de envueltos |
0.5 a menos de 1.0 | 6 |
1.0 a menos de 1.5 | 12 |
1.5 a menos de 2.0 | 30 |
2.0 a menos de 2.5 | 42 |
2.5 a menos de 3.0 | 28 |
3.0 a menos de 3.5 | 12 |
Total | 130 |
Problema #4:Coeficiente de
Variación
Los datos a continuación describen las
distribuciones de puntuaciones en determinados grupos
ocupacionales sometidos a la prueba general de clasificaciones
del ejercito durante el último año.
Ocupaciones | N | | S | Rango |
Contador | 172 | 128.1 | 11.7 | 94-157 |
Abogado | 94 | 127.1 | 10.9 | 96-157 |
Periodista | 45 | 124.5 | 11.7 | 100-157 |
Vendedor | 492 | 109.2 | 16.3 | 42-149 |
Plomero | 128 | 102.7 | 16.0 | 56-139 |
Camionero | 817 | 96.2 | 19.7 | 16-149 |
Campesino | 817 | 91.4 | 20.7 | 24-141 |
Carpintero | 77 | 89.0 | 19.6 | 45-145 |
Compare los resultados obtenidos para cada grupo
ocupacional utilizando el coeficiente de variación y el
rango o recorrido. Comente los resultados.
Problema #5: Coeficiente de
Variación
La tabla a continuación indica los salarios
básicos por hora (en unidades monetarias) en abril 200X
para ciertas categorías ocupacionales de obreros
sindicalizados en cierto sector de la construcción. Determine cuál es la
ocupación en la que existe la mayor variación en
los salarios básicos y cuál es la que muestra la
menor variación. Para hacer estas comparaciones
deberá utilizar el coeficiente de
variación.
Salarios básicos por hora,
según tipo de trabajo y lugares
encuestados
Ocupación | A | B | C | D |
Albañiles | 6.290 | 7.375 | 5.750 | 7.500 |
Carpinteros | 5.900 | 7.020 | 5.370 | 6.660 |
Electricistas | 7.500 | 7.600 | 6.700 | 7.335 |
Pintores | 7.170 | 6.735 | 4.750 | 6.110 |
Enyesadotes | 5.920 | 7.045 | 5.940 | 6.825 |
Plomeros | 8.000 | 4.450 | 6.250 | 7.080 |
Ayudantes | 4.020 | 4.780 | 3.180 | 4.700 |
Francisco Antonio Cabrera
González
f_cabrera51[arroba]hotmail.com
Graduado en mayo de 1980 de Economista-Organizador de la
Producción Agrícola y Master en
Ciencias
Económicas en la Academia Agrícola K. A. Timiriazev
de Moscú –Rusia.
Profesor de la Universidad de
Panamá
desde 1981. Ha ejercido la docencia
universitaria en los Centros Regionales de Azuero
(Chitré), Los Santos, Veraguas, Coclé y San
Miguelito. Catedratico (Profesor Regular) desde 1991 del
Departamento de Estadística Económica y Social de
la Facultad de Economía.
En su vida universitaria, como docente, ha sido
representante de los profesores del CRU-Azuero (Chitré)
ante el Consejo General Universitario -CGU (1990-1992),
Vicepresidente de la Asociación de Profesores de la
Universidad de Panamá –APUDEP (1991-1993),
Presidente de la APUDEP (1993-1995), Director del Centro Regional
Universitario de San Miguelito –CRUSAM (1995-2000) y en la
actualidad es docente investigador de la Universidad de
Panamá.
UNIVERSIDAD DE PANAMÁ
CENTRO REGIONAL UNIVERSITARIO DE SAN
MIGUELITO
FACULTAD DE ECONOMÍA
DEPARTAMENTO DE ESTADÍSTICA ECONÓMICO Y
SOCIAL
Curso: Est.115 : "Estadística Económica
I".
Página anterior | Volver al principio del trabajo | Página siguiente |