Ej.
Obs.
- el valor del
coeficiente de variación es independiente de las
unidades de los datos. - el coeficiente de variación CV > 0, luego
Ejercicios.
- Determine el coeficiente de variación de la población P = {12, 34, 56, 32, 67, 86,
54} - Compare los coeficientes de variación de las
siguientes poblaciones y dé una conclusión en
base a los resultados obtenidos.
P1 (Kg.) = {21, 87, 104, 204, 12} P2
(años) = {10, 20, 30, 40, 50, 60, 70}
P3 (mts.) = {7, 12, 456, 598, 978, 2} P4
($) = {101, 220, 130, 440, 550, 760, 708}
- Determinación del número de elementos de
un rango.
Ej. Si consideramos la media aritmética = 35,5 y la
desviación típica s = 14,4 de la distribución de frecuencias indicada en la
tabla siguiente:
li | ls | fi | xi | xi*fi | fi*(xi-x')^2 |
0 | 10 | 2 | 5 | 10,00 | 1863,55 |
11 | 21 | 5 | 16 | 80,00 | 1906,13 |
22 | 32 | 9 | 27 | 243,00 | 654,08 |
33 | 43 | 12 | 38 | 456,00 | 73,51 |
44 | 54 | 8 | 49 | 392,00 | 1452,61 |
55 | 65 | 4 | 60 | 240,00 | 2396,10 |
40 | 1421,00 | 8345,98 | |||
35,53 | 208,65 | ||||
14,44 |
Determine el número de datos del rango (– s; + s).
Solución. El rango (– s; + s) = (35,5 – 14,4 ; 35,5 + 14,4) = (21,1 ;
49,9).
El número de elementos de este rango es = nº
(22 ; 32) + nº (33 ; 43) + nº (44 ; 49,9)
= 9 + 12 + x
el valor de x se calcula mediante la regla
proporcional
x = (5,9 * 8) / 10 = 4,72
Luego el total de elementos que contiene el rango
es:
9 + 12 + 4,72 = 25,72.
- Determinación del porcentaje de elementos
pertenecientes a un rango.
Ej. Calcular además el % del total de datos que
pertenecen a ese rango, si se consideran los datos
del ejemplo anterior.
Solución. El total de elementos pertenecientes al
rango es 25,72, que representa el:
25,72*100/40 = 64,3 % del total de frecuencias de la
población.
- Cálculo del número y porcentaje de
datos pertenecientes a un rango
interfractilítico. - Si el rango es del tipo (Q1,
D7) el porcentaje entre las dos medidas es 70% –
20% = 50%.
- Si el rango es del tipo (Q1,
Ej. En una población de 40 datos, al rango
anterior contiene a 50% de 40 = 20 elementos.
- Otros rangos interfractilíticos a los cuales
se les puede obtener sus frecuencias y % son:
- Rango intercuartilítico.
- Rango interpercentilítico.
- Rango interquintilítico.
- Rango interpercentilítico –
cuartilíticos.
Ejercicios.
1. Considerando los datos entregados por la tabla
siguiente, determine número y % de personas que contienen
los siguientes rangos:
1.1 (Q1, P78) 1.2 (C1,
D8) 1.3 (D3, D7)
1.4 (Q1, Q6) 1.5 (C3,
P90) 1.6 (P10, P90)
sueldo | 101 | 125 | 186 | 265 | 295 | 340 | 456 | 589 | 604 | 780 |
Nº de personas | 14 | 25 | 34 | 56 | 45 | 36 | 28 | 15 | 12 | 5 |
- Análisis del Sesgo.
Def. El coeficiente de SESGO determina el grado de
asimetría (alargamiento de la
distribución
hacia la izquierda o hacia la derecha). Para determinar
el sesgo de una distribución de frecuencias se utiliza el
:
- Si el coeficiente de sesgo tiene un valor positivo se
dice que la distribución es SESGADA a DERECHA o que
tiene SESGO POSITIVO.
- Si el coeficiente de sesgo tiene un valor negativo se
dice que la distribución es SESGADA a IZQUIERDA o que
tiene SESGO NEGATIVO.
- Si el coeficiente de sesgo tiene un valor 0 se dice
que la distribución es INSESGADA o que tiene SESGO
0.
sesgo negativo sesgo positivo insesgada
Obs. Otras expresiones que se utilizan para el sesgo
son:
- Análisis de la Curtosis
El coeficiente de CURTOSIS determina el grado de
alargamiento de la distribución hacia arriba o
hacia
abajo. Para determinar la curtosis de una distribución de
frecuencias se utiliza el:
– Si el coeficiente de curtosis es mayor que 3 se dice
que la distribución es LEPTOCÚRTICA.
– Si el coeficiente de curtosis es menor a 3 se dice que
la distribución es PLATICÚRTICA
– Si el coeficiente de curtosis es igual a 3 se dice que
la distribución es MESOCÚRTICA.
Mesocúrtica Leptocúrtica
Platicúrtica.
Ej. Sea la población P cuyos elementos (40)
están distribuidos de la manera que indica la tabla
siguiente:
Lim.Inf. | Lim.Sup. | fi | xi | fi xi | xi – x | (xi -x )2 | (xi – x )3 | (xi – x )4 |
0 | 10 | 2 | 5 | 10 | -30.5 | 1860.5 | -56745.25 | 1730730.1 |
11 | 21 | 5 | 16 | 80 | -19.5 | 1901.25 | -37074.375 | 722950.31 |
22 | 32 | 9 | 27 | 243 | -8.5 | 650.25 | -5527.125 | 46980 |
33 | 43 | 12 | 38 | 456 | 2.5 | 75 | 187.5 | 468.7 |
44 | 54 | 8 | 49 | 392 | 13.5 | 1458 | 19683 | 267520.5 |
55 | 65 | 4 | 60 | 240 | 24.5 | 2401 | 58824.5 | 1441200.2 |
Totales | 40 | 1421 | 8348 | -20648.75 | 4208054.422 |
Entonces, para analizar sesgo y curtosis se necesitan
los siguientes datos:
- =
1421 / 40 = 35,5 - v = 8346 / 40 = 208,7
- s = 14,44
- =
-20648,75 / 40 = -516,21 - =
4208054,422 / 40 = 105201,36 - coef. sesgo = -516,21 / 3010,93 = – 0,171 <
0 - coef. curtosis = 105201,36 / 43477,92 = 2,41 <
3
Conclusión. La población P es sesgada a la
izquierda y platicúrtica.
Obs. Otra expresión que se utiliza para medir la
curtosis de una población es:
Obs. Este coeficiente para una distribución
normal es 0,263
Ejercicios.
1. La tabla dada representa los años de servicio de 52
personas de una empresa
textil:
Años de servicio | 0 – 3 | 4 – 7 | 8 – 11 | 12 – 15 | 16 – 19 | 20 – 25 |
frecuencia | 8 | 10 | 15 | 9 | 6 | 4 |
1.1 Construya un gráfico lineal para dicha
población.
1.2 Determine sesgo y curtosis de la
población.
1.3 Dé una interpretación a los resultados
obtenidos.
1.4 Encuentre el número de personas que
pertenecen al intervalo (mediana – d: moda +
s)
1.5 Encuentre el número de personas que
pertenecen al rango (Q1, P83)
1.6
Determine el porcentaje de personas que pertenecen al
intervalo
2. Obtenga una muestra de 10
datos de la población dada en el cuadro siguiente
aplicando el azar.
123 213 345 234 65 365 45 214
78 465
324 210 567 23 76 241 45 1287
598 587
456 43 765 34 88 854 365 65 236
685
432 54 234 65 976 458 1258 258
2541 954
2.1 Compare las medidas estadísticas de posición de la
muestra con las respectivas de la población.
2.2 Compare las medidas de dispersión de la
muestra con las respectivas de la población.
2.3 Encuentre el número de personas que
pertenecen al intervalo (mediana – s: moda + s) de la
población.
2.4 Encuentre el número de personas que
pertenecen al rango (Q1, P93) de la
población.
2.5 Determine el porcentaje de personas que pertenecen
al intervalo:
3.
3.1 Clasifique los datos dados en el item 2 en a lo
menos cinco clases.
3.2 Compare las medidas estadísticas de
dispersión de la muestra con las respectivas de la
población y las de su clasificación.
3.3 Compare las medidas estadísticas de
posición de la muestra con las respectivas de la
población y las de su clasificación.
4. En la tabla contiene los datos de un estudio
realizado sobre las edades de un grupo de
personas.
0 a 10 años | 23 | |||||||||
10 a 20 años | 34 | |||||||||
20 a 30 años | 47 | |||||||||
30 a 40 años | 53 | |||||||||
40 a 50 años | 45 | |||||||||
50 a 60 años | 15 | |||||||||
60 a 70 años | 18 | |||||||||
70 a 80 años | 4 |
4.1 Determine las medidas de posición de dicho
estudio
4.2 Determine las medidas de dispersión de dicho
estudio
4.3 Analice sesgo y curtosis.
4.4 ¿Cree Ud. que la villa, según los
datos que obtuvo, se puede considerar "vieja"?
4.5 Encuentre el número de personas que
pertenecen al intervalo (media aritmética – s: moda +
s)
4.6 Encuentre el número de personas que
pertenecen al rango (Q1, D8)
4.7 Determine el porcentaje de personas que pertenecen
al intervalo:
5. En una empresa que
fabrica tubos de cemento se
analiza la producción mensual, en unidades de
producción, obteniéndose los siguientes
datos:
Enero | Febrero | Marzo | Abril | Mayo | Junio | Julio | Agosto | Sept. | Oct. | Nov. | Dic. |
1450 | 1234 | 2345 | 1678 | 3245 | 1897 | 2087 | 1980 | 2313 | 1008 | 2056 | 1235 |
5.1 ¿Cuál es el promedio anual?
5.2 Si ese promedio anual se considera como la
producción normal de la empresa
¿en cuántos meses se produjo menos de lo normal y
en cuántos mas de lo normal?
5.3 Construya un gráfico circular de los datos
dados en la tabla indicando el % que representa cada mes con
respecto a la producción anual.
6. Indique el % que corresponde a cada clase
según los datos y el gráfico dados.
Distribuciones
Bidimensionales
Def. Una DISTRIBUCION BIDIMENSIONAL es una tabla de
doble entrada en la cual participan dos variables
simultáneamente. Cada dato obtenido verifica las dos
variables.
Ej. Si se analiza una población de reos que sean
monreros y que tengan una edad entre los 20 y 30 años,
entonces, todos aquellos reos que cumplan ambas condiciones,
pertenecen a dicho grupo o clase.
Gráfico de una distribución
bidimensional.
Tabulación de una distribución
bidimensional.
Los datos de una distribución bidimensional en
las variables X y Y se tabulan en una tabla de doble
entrada.
donde Xi son los valores (o
marcas de las
clases) de la variable X; Yi son los valores (o
marcas de las clases) de la variable Y y Fij son las
frecuencias relativas a las dos variables.
Ej. La tabla siguiente entrega los datos de un estudio
con respecto de la edad de mujeres y de hombres en matrimonios
constituidos legalmente:
La frecuencia F23 = 18 representa el
número de matrimonios donde la edad de la mujer
está entre los 19 a 22 años y la edad de los
hombres entre los 26 a 30 años.
Obs. Para determinar algunas medidas estadísticas
para distribuciones bidimensionales, con datos clasificados, se
utiliza la siguiente: Tabla de las marcas de las clases de la
distribución bidimensional.
Según los datos dados de la distribución
bidimensional del ejemplo anterior, el gráfico
correspondiente es:
Distribuciones Marginales
Def. La distribución que contiene sólo las
frecuencias de la variable X, se le llama
distribución
MARGINAL de X con respecto a Y. Análogamente, si
se consideran sólo las frecuencias de la
variable Y se le llama distribución MARGINAL de Y
con respecto a X..
Ej. Tabla marginal de las edades de las
mujeres. Tabla marginal de las edades de los hombres
Total 200
Distribuciones Condicionales
A la distribución de las frecuencias de la
variable X ( ó Y) con algún intervalo de la
distribución de las frecuencias de la variable Y (
ó X ) se le llama DISTRIBUCION CONDICIONAL.
Ej. Los datos ennegrecidos del gráfico,
corresponden al total de matrimonios cuyas mujeres tienen una
edad entre los 19 años y los 32 años y cuyos
hombres tienen una edad entre los 21años y los 30
años. En total serían 14 + 18 + 8 + 20 + 5 + 9 =
74.
Medidas en una distribución
bidimensional.
Covarianza.
Correlación.
Def. La CORRELACIÓN de una relación entre dos
variables, nos indica el grado de relación existente entre
ellas. Uno de los instrumentos que se utilizan para determinar la
correlación es el Coeficiente de Correlación, cuyo
valor se determina mediante la expresión:
Ej. Consideremos la distribución bidimensional de los
200 matrimonios dados en la tabla anterior.
Determine la correlación entre las edades de las
mujeres y la de los hombres.
Marcas | hombresè | |||
Marcas mujeres ê | 17,5 años | 23 años | 28 años | 33 años |
16,5 años | 13 | 12 | 15 | 4 |
20,5 años | 6 | 14 | 18 | 10 |
24,5 años | 3 | 8 | 20 | 14 |
29,5 años | 2 | 5 | 9 | 23 |
34 años | 1 | 2 | 3 | 18 |
17,5 | 23 | 28 | 33 | |||||||
16,5 | 3754 | 4554 | 6930 | 2178 | ||||||
20,5 | 2153 | 6601 | 10332 | 6765 | ||||||
24,5 | 1286 | 4508 | 13720 | 11319 | ||||||
29,5 | 1033 | 3393 | 7434 | 22391 | ||||||
34 | 595 | 1564 | 2856 | 20196 | ||||||
XI | YI | FI | GI | Xi*Fi | Yi*Gi | (xi-x)^2*fi | (yi-y)^2*gi | |||
17,5 | 16,5 | 25 | 44 | 437,5 | 726 | 2444,066406 | 2406,1851 | |||
23 | 20,5 | 41 | 48 | 943 | 984 | 789,2564063 | 553,2492 | |||
28 | 24,5 | 65 | 45 | 1820 | 1102,5 | 24,38515625 | 16,471125 | |||
33 | 29,5 | 69 | 39 | 2277 | 1150,5 | 2173,510781 | 1225,224975 | |||
0 | 34 | 0 | 24 | 0 | 816 | 0 | 2450,6646 | |||
5477,5 | 4779 | 5431,21875 | 6651,795 | |||||||
x | y | |||||||||
media aritmética | 27,39 | 23,90 | ||||||||
varianza desviación típica | 27,1560 5,21 | 33,2589 5,77 | ||||||||
covarianza | 13,376 | |||||||||
correlación | 0,4451 |
Conclusión: como el coeficiente de
correlación es positivo (0,4451) se concluye que cuando la
edad de la mujer aumenta la
edad del hombre
también aumenta.
Ejercicios.
Determine la correlación de la tabla
bidimensional que relaciona los años de servicio con los
sueldos, en miles de $, de una institución fiscal.
Años de servicioê | Sueldos è 70 a 99 | 100 a 129,99 | 130 a 159,99 | 160 a 189,99 | 190 a 220 |
0 a 2,99 | 12 | 4 | 5 | 3 | 2 |
3 a 5,99 | 10 | 8 | 9 | 6 | 3 |
6 a 8,99 | 6 | 5 | 12 | 8 | 6 |
9 a 11,99 | 3 | 4 | 9 | 12 | 12 |
12 a 14,99 | 2 | 2 | 4 | 8 | 7 |
15 a 18 | 2 | 1 | 3 | 4 | 3 |
1.1 Determine sesgo y curtosis de las dos distribuciones
marginales de item 1.
1.2 Determine sesgo y curtosis de las distribuciones
condicionales siguientes:
1.2.1 Años de servicio con los sueldos desde 130
a 190 mil pesos
1.2.2 Sueldos con los años de servicio desde los
6 a 15 años
1.3 Determine la correlación entre las
variables.
2. El gráfico siguiente representa un estudio
entre los años de edad de los fallecidos en los cuatro
trimestres de un año cualesquiera.
2.1 Construya una tabla bidimensional de dicho
gráfico
2.2 Construya la tabla marginal de los trimestres con
respecto a los años de los fallecidos
2.3 Determine cuantos fallecidos hubo entre el segundo y
tercer trimestre de personas que tenían entre 20 y 40
años
- El siguiente cuadro contiene los datos de la
relación peso (en Kgs.) y altura (en mts.) de personas
pertenecientes a una población X.
- Determine la correlación de las variables
peso – altura. - Analice su resultado.
- El siguiente cuadro representa los datos de la
relación de la variable años de trabajo (en
años) y de la variable sueldo (en miles de $) de
empleados de una empresa X.
- Determine la correlación de las variables
años de servicio – sueldo. - Analice su resultado.
- ¿ Cuántas personas tienen entre 11 y
20 años de servicio y ganan un sueldo mayor de 200 y
menor 801 mil pesos?.
Curvas de
ajuste
En la relación entre dos variables X y Y, por
ejemplo, entre costo y venta de una
determinada empresa, muchas veces no se advierte una tendencia
clara de dicha relación. En algunos períodos esta
venta es creciente, en otras decrecientes, o bien, es
estable.
Para determinar alguna tendencia que pueda proyectarse
en el tiempo, la
estadística hace uso de funciones
matemáticas, como la línea recta, la
parábola, y en general, funciones polinomiales,
logarítmicas, exponenciales, trigonométricas
reales. A estas funciones se les denominan
CURVAS DE AJUSTE.
Curva de Ajuste Lineal.
Sean los n datos o puntos (x1 , y1
), (x2 , y2 ),….., (xn ,
yn ), de la relación entre las variables X y Y,
que se muestran en la tabla siguiente:
Variable X | x1 | x2 | x3 | …. | …… | xn |
Variable Y | y1 | y2 | y3 | … | …… | yn |
Método libre.
Para determinar la ecuación de una línea
recta de ajuste, por el método
libre, se seleccionan dos puntos cualesquiera de los n datos.
Reemplazando los datos elegidos, A(x1, y1)
y B(x2, y2), en la
ecuación:
se obtiene la ecuación de la Curva de ajuste
lineal.
Ej. La producción quincenal de cobre se
presenta en la siguiente tabla:
Quincena | 1ª | 2ª | 3ª | 4ª | 5ª | 6ª |
Producción en ton. | 2 | 6 | 4 | 8 | 5 | 9 |
Consideremos los puntos A(1, 2) y B(6, 9). La curva de
ajuste lineal libre tiene por ecuación la
expresión:
Según la curva de ajuste resultante, según
cuadro y gráfico, se puede apreciar que la tendencia de
producción sería creciente en las próximas
quincenas.
Quincena | 7ª | 8ª | 9ª | 10ª | 11ª | 12ª |
Producción en ton. | 10,4 | 11,8 | 13,2 | 14,6 | 16 | 17,4 |
Página anterior | Volver al principio del trabajo | Página siguiente |