4. El costo de 25
artículos es el siguiente:¿ Conviene agrupar o
construir un cuadro de frecuencias? Le sugiero
ordenar en una serie de frecuencias o tipo II. Luego
encuentre:
La mediana
40 – 43 – 40 – 46 –
40 La moda
41 – 44 – 45 – 45 –
42 La media geométrica
42 – 43 – 41 – 43 –
41
43 – 44 – 42 – 44 –
40
44 – 41 – 40 – 44 –
40
5. Verifique si el modo es 46,62; por el
método que
indica el texto
básico pág. 78.
AUTOEVALUACIÓN
1 . E N C I E R R E E N U N C Í R
C U L O E L A S T E R I S C O D E L E N U N C I A D
O
C O R R E C T O
* Las medidas de tendencia central son las
que toman en consideración al valor
alrededor del cual se agrupan los demás valores de la
variable.
* La media aritmética es la suma de
las puntuaciones dividida para el número de
casos.
* La mediana divide a una serie en dos
partes con igual número de casos a cada lado.
* La media geométrica es utilizada
cuando la serie corresponde a una progresión
geométrica.
2. COMPLETE
Las últimas calificaciones de
Liliana en matemáticas fueron: 13 – 16 –
16 –17 – 14 – 12
–11 – 10.
La media aritmética es
La mediana
La moda
¿Para qué nos sirven estas
medidas de tendencia central?
Una vez que usted sabe calcular estas
medidas también debe conocer su utilidad.
En las unidades 13 –16 de su texto
básico puede usted enriquecerse con este
contenido.
Por Ejemplo:
Tenga presente que entre las
múltiples aplicaciones de la mediana
tenemos:
Nos sirve para encontrar el valor central
de una serie.
Nos ayuda a dividir el área de un
polígono de frecuencias en dos part iguales.
Nos sirve para verificar una
hipótesis
Su cálculo
determina el valor central más fiable en ciertos tipos de
variables:
cualitativas como: salarios,
estaturas, pesos, etc.
El modo, se utiliza para resaltar lo
más sobresaliente de una investigación.
UNIDAD #
6.
Medidas de
Dispersión
RANGO
VARIANZA
DESVIACIÓN MEDIA
DESVIACIÓN
TÍPICA
En la unidad anterior se estudiaron las
medidas de la tendencia central en lo que se refiere
a su cálculo, significado y empleo. Sin
embargo, como se pondrá de manifiesto en esta
unidad, dichas medidas, por sí mismas, no son
suficientes para describir la distribución.
Los promedios determinan el centro de la
distribución, pero nada indican acerca de
cómo están situados los datos, medidas o
puntuaciones respecto al centro.
Veamos dos ejemplos:
Al presentar estas dos distribuciones de
las puntuaciones obtenidas en un mismo test;
vemos que cada una tiene de media el valor 67. En la
primera, la puntuación mayor es 72 y la menor
es 62. En la segunda distribución, la puntuación
más alta es 107 y la más baja 25. El
recorrido de la primera distribución es 11, mientras que
el correspondiente de la segunda es 83.
Atención
Por esta razón, y para obtener una
imagen
más nítida de una distribución, se necesita
conocer tanto una medida de la tendencia central
como otra de la variabilidad Es decir su dispersión
y su forma.
En estadística se expresa que la primera
distribución del ejemplo es de un grupo
homogéneo. Los elementos dentro del mismo son muy
parecidos en cuanto a la cualidad medida. La otra
distribución corresponde a un grupo heterogéneo,
porque la variabilidad es grande. Estos dos
términos se usan mucho en sicología, sociología y pedagogía, comunicación, etc.
¿ QUÉ MEDIDAS NOS AYUDANA
EFECTUAR UNA DISTRIBUCIÓN?
EL RANGO O RECORRIDO
El recorrido se define como la diferencia
entre las puntuaciones mayor y menor . Algunos a este valor
aumentan la unidad. Recuerde que utilizamos cuando se
trató de la representación de una
distribución de frecuencias.
De todos las mediadas de dispersión,
el recorrido es la más inestable. Esto quiere decir que de
una muestra a otra,
el recorrido varía más que cualquiera de las otras
medidas.
Un ejemplo aclarará lo dicho.
Supongamos una distribución de puntuaciones, siendo 30 la
menor y 103 la mayor. La puntuación inmediatamente
inferior a 103 es 90. Teniendo en cuenta la
definición, el recorrido es 74; sin embargo, 13 de los
puntos que integran este recorrido corresponden a la
puntación más alta 103. La posibilidad de que la
muestra siguiente no contenga esta puntuación
alta y desviada es grande y, por tanto, el recorrido
será mucho menor. El recorrido, lo mismo que la
moda, es un estadígrafo muy inestable, ya que
puede variar considerablemente de una muestra a otra.
El empleo del recorrido puede estas
justificado cuando se precise rápidamente una medida de
dispersión y no haya tiempo de
calcular alguna de las otras. No obstante, si se
considera la población en lugar de una muestra, el
recorrido sería mucho más útil.
En el siguiente cuadro ¿Cuál
es el rango?. Usted ya lo encontró es 22. Por que 26-04 =
22
El rango en el cuadro 17.1 de su texto
básico es …….?
LA DESVIACION MEDIA
Vamos a la unidad 18 del texto
básico para descubrir a esta medida.
La desviación media, también llamada
desviación promedio, apenas se emplea en
estadística, habiendo sido sustituida por la
desviación típica. Sin embargo, un breve examen de
este estadígrafo hará más fácil
comprender el significado de la desviación típica.
Antes de proseguir definiremos con el símbolo (d)
la desviación (diferencia) de una
puntuación cualquiera respecto de la media
aritmética. Matemáticamente.
d =
siendo d = desviación
X = puntuación bruta
En cualquier distribución, la suma
de las desviaciones respecto de la media es nula.
Como se observó anteriormente,
constituye una propiedad muy
importante de la media.
Cálculo de la
desviación media
Puesto que la suma de las desviaciones
respecto de la media es cero, se deduce que no es
posible calcular la desviación media a menos que se
modifique en algo el procedimiento de cálculo. En
la práctica, la desviación media, es la media
aritmética de las desviaciones consideradas
en valor absoluto (prescindiendo del signo). La definición
matemática
de la desviación media es.
El cálculo ordenado de la
desviación media muestra en el ejemplo. Para dicha
distribución, las puntuaciones se
desvían, en promedio, 6 unidades de la media.
¿Cómo calcular las
distribuciones en una serie de frecuencias y de
intervalos?
Su fórmula será igual.
¿Por qué?. Analice la página 95 cuadro 18.1
y verifique su desarrollo.
LA DESVIACIÓN
TÌPICA
De todas las medidas de dispersión,
la desviación típica es la medida que más se
utiliza en la práctica. Empezaremos por
indicar cómo se calcula, tanto en el caso de datos
agrupados como no agrupados.
Con datos no agrupados, el proceso se
inicia de la misma forma que si se tratara de hallar
la desviación media. Es decir, en primer lugar, se
calcula la media. Luego se hallan las desviaciones
de cada puntuación respecto de dicha media. Después
se elevan al cuadrado cada una de estas desviaciones
y se suman los resultados obtenidos.
Tenga presente que una forma de ir
comprobando la bondad de los cálculos consiste en observar
que la suma de las desviaciones respecto de la media (suma de las
x) es cero.
En nuestro caso en Estadística
descriptiva solo interesa conocer cómo se distribuyen,
respecto de la media de la muestra, un conjunto de datos o
puntuaciones.
Cálculo de la desviación
típica en el caso de datos no
agrupados : = 12.4
En el ejemplo la desviación
típica (s) es 4.5.
Algunos autores la representan por
Otros ejemplos usted encontrará en
su texto básico página 90.
Si se dispone de una máquina de
calcular, es más cómodo aplicar la fórmula
que se llama de las puntuaciones brutas para obtener
la suma de los cuadrados de las
desviaciones. En la misma, se han escrito
las puntuaciones y la primera columna se encabeza
por la letra X. La segunda columna es, sencillamente, el cuadrado
de cada
d. (Luego se suman los valores en
ambas columnas. Debe observarse que si se emplea una
máquina de calcular, no es necesario escribir las
puntuaciones originales o sus cuadrados, como
aparecen a continuación.
Se registran las puntuaciones en la
máquina una a una, y en la misma se acumula la
suma.
Al final, ambos valores se leen
directamente en la máquina. Con este modo de
proceder, la suma de cuadrados (de las desviaciones)
viene dada por la siguiente fórmula:
Este valor de la suma de cuadrados es el
mismo que se obtiene al sumar los cuadrados de las
desviaciones de cada puntuación respecto de la media.
Aún sin máquina de calcular, el
método anterior puede resultar más cómodo
que el primero. Obtenida la suma de cuadrados, se
sustituyen los valores en la fórmula dada.
Cálculo directo de la
desviación típica a partir de las
puntuaciones brutas
Otros ejemplos usted encontrará en
su texto básico página 90, a fin de que
desarrolle este ejercicio.
A veces, se abrevia la expresión
calculando por medio de la fórmula que plantea su texto
básico en la unidad 19.
¿Cuál le parece más
fácil?
Cómo se podrá cuenta la
combinación de este cálculo da lugar a la
desviación típica a partir de las puntuaciones
brutas:
¿Qué sucede si la serie es
de frecuencias o tipo II?
Tendremos que incluir este dato.
Así:
s=
LA DESVIACIÓN TÍPICA EN EL
CASO DE DATOS AGRUPADOS.
El ejemplo que plantea su texto
básico en la página 98. Puede usted calcular de
manera más abreviada. Siguiendo el mismo procedimiento
anterior.
Recuerde:
Que para calcular la desviación típica:
primero encontramos la media aritmética, luego las
desviaciones al cuadrado y finalmente sumamos el producto de
las frecuencias por las desviaciones elevadas al
cuadrado.
Por lo tanto necesitamos obtener las
siguientes columnas
X | f | Xm | d | d2 | fd2 |
La misma fórmula resume este
cálculo:
OTRA MEDIDA DE VARIABILIDAD O DE
DISPERSIÓN ES LA VARIANZA Su cálculo es similar a
la desviación típica..
Observe y analice su representación
puesto que es el mismo valor de la desviación
típica elevada al cuadrado.
Tenga presente que el recorrido
intercuartílico, que presentaremos por la letra Q,
se llama a veces desviación
cuartílica. En la unidad siguiente hablamos de cuartiles,
Q1 o centil veinticinco, y Q3 o centil setenta y
cinco. El recorrido intercuartílico es la mitad de
la distancia entre estos dos cuarteles.
Matemáticamente se puede escribir:
Su texto básico presenta una
amplia información al
respecto.
Esta medida es muy fácil de calcular. Para
explicarlo de una manera sencilla se ha realizado la siguiente
serie con la distribución de las puntuaciones de un test
de Estadística. En primer lugar se han de calcular Q1 y
Q3. Por definición, Q1 es el punto de la
distribución que deja un 25 por 100 de las puntuaciones
por debajo de él. El 25 por 100 de 40 casos
es 10.
Cálculo del
recorrido
intercuartílico
Haciendo el recuento de casos a partir del
extremo inferior se obtiene que hasta el
límite inferior del intervalo 45-49 hay exactamente
10 casos. No es preciso realizar
interpolación alguna en estas circunstancias, con lo
que Q1 = 44,5. Para hallar Q3, se repite el
procedimiento, salvo que en lugar de contar el 75 por 100 de los
casos a partir del extremo inferior se hace el
recuento del 25 por 100 a partir del extremo superior.
En estas condiciones se deduce que hasta
64,5 (límite inferior del intervalo 65-69) hay 7
casos. Se precisan, pues, 3 casos más. El intervalo
citado contiene 4 casos, con lo que se hallan los
tres cuartos de su amplitud. La operación se realiza como
sigue:
INTERPRETACIÓN DE
Q.
En una distribución normal, si a
partir de la mediana se llevan a cada lado un recorrido
intercuartílico se abarca, aproximadamente, el 50 por 100
de los casos.
¿CUANDO EMPLEAR EL RECORRIDO
INTERCUARTÍLICO?.
Como el recorrido intercuartílico
está asociado a la mediana, se deduce que siempre
que se utilice la mediana como medida de la
tendencia central, el recorrido intercuartílico es
una medida apropiada de la dispersión. Recordemos
que la mediana es el estadígrafo que se ha de
emplear como medida de tendencia central cuando la
distribución sea asimétrica. Aun en
estas condiciones de asimetría, la comprobación se
hará considerando el 50 por 100 de los
casos.
AUTOEVALUACION
En el paréntesis correspondiente
escriba una V si el enunciado es verdadero o una F
si el enunciado es falso.
1. | Las medidas de dispersión nos | ||||||||||||||||||||
datos en relación a la | ( ) | ||||||||||||||||||||
2. | La suma algebraica de las | ( ) | |||||||||||||||||||
3. | La desviación media nos ayuda | ( ) | |||||||||||||||||||
4. | Al coeficiente de variación se | ( ) |
En el siguiente conjunto de datos:
14,12,12,10,10,10,8,8,7
5. | La desviación media es | ( ) | |||||||||||||||||||
6. | La varianza es 4.54 | ( ) | |||||||||||||||||||
7 | La desviación típica es | ( ) | |||||||||||||||||||
8. | El rango es 14 | ( ) | |||||||||||||||||||
9. | El rango semicuartílico es | ( ) |
10. El símbolo de la varianza es s2
( )
UNIDAD # 7.
Cuartiles,
deciles y percentiles de una serie estadística simple y de
frecuencias
Estas medidas son una generalización
de la mediana, de tal forma que si la mediana
divide a la serie en dos partes iguales,
los cuartiles la dividen en cuatro partes
iguales,
los deciles en diez partes iguales,
y los centiles en 100. Es decir.
CUARTILES (Q), divide la serie en 4 partes
iguales (25 % c/u) DECILES (D), divide a la serie en 10 partes
iguales (10 % c/u)
CENCILES o PERCENTILES (C) ¿ En
cuánto dividirán a una serie
estadística?
Recuerde:En una distribución
normal a partir de la mediana podemos dividir las series en
partes iguales. La frecuencia acumulada bien obtenida nos
facilita el cálculo respectivo. Por lo tanto tenga
presente que la frecuencia acumulada es la suma de las
frecuencias desde la menor variable. Estas medidas son muy
utilizadas en medicina,
educación,
economía etc.
Para determinar los cuartiles, generalmente
se calculan las frecuencias acumuladas y se busca el
valor de la variable que ocupa la posición N/4 si es
Q1 (cuartil 1), o 2N/4 si es Q2
(cuartil 2), o 3N/4 si es Q3 (cuartil 3).
De igual forma para determinar los deciles aplicamos el
mismo procedimiento: El primer decil es el valor de la variable
que ocupa la posición N/10. El segundo es el valor que
ocupa la posición 2N/10 y así sucesivamente, hasta
el noveno que es el valor que ocupa la
posición 2N/10.
Ejemplo
Siguiendo el proceso anterior , y si
deseamos obtener el Q3, D7 y C48.
Tenemos, primero que obtener la frecuencia
acumulada, luego la posición.
Así.
¿ Q u e o p i n i ó n m e
re c e n e s t a s m e d i d a s e n u n a s e r i e d e i n t e
r v a l o s ?
El proceso para calcular los cuartiles,
centiles o los percentiles es igual a los anteriores.
Es decir, se debe :
Es decir, cuando tenemos una serie
estadística de intervalos el cálculo de los
cuartiles, deciles y centiles se lo hace de forma similar a la
mediana, sus fórmulas son similares a esta
medida.
Por ejemplo:
En una clínica de la ciudad de Loja,
por medio de una encuesta se
pregunto la edad a los enfermos, se tabulo la información
y se obtuvieron los siguientes resultados.
Determine;
a) El segundo cuartil b) El sexto
decil
c) El centil 50
Desarrollo:
a) Primero encuentre la posición del
cuartil 2
2 N/4 = 2.105/4 = 52.5
Este valor se localiza en la frecuencia
acumulada (próximo mayor). Observamos que
el intervalo donde se encuentra este valor
es (30 – 34 ) y para el calculo matemático
se
emplea la fórmula.
Quiere decir que Quiere decir que el 50 %
de enfermos tienen una edad inferior a 30,75
años.
b) Calculamos la posición del 6
decil
6N/10 = 6.105/10 = 63
Este valor esta localizado en el mismo
intervalo del cuartil 2, para su cálculo
matemático se aplica la
fórmula.
Es decir el 60% de los enfermos tienen
edades inferiores a 33 año.
¿El cálculo del
Cserá igual al de la mediana? Justifique su
respuesta
AUTOEVALUACIÓN
1. En el paréntesis
correspondiente escriba una C o una I si el enunciado es
correcto o incorrecto.
a) | El cuartil 50 divide a la serie en | ( | ) | |||||||||||||||||||||||||||||||
b) | El decil 5 de la siguiente serie: | ( | ) | |||||||||||||||||||||||||||||||
c) | El centil 50 de la serie anterior es | ( | ) | |||||||||||||||||||||||||||||||
d) | El valor de la mediana es igual al | ( | ) |
2. En los cuadros siguientes determine
el valor correspondiente a las medidas anotadas
Resumen…
Antes de desarrollar las actividades de las
evaluaciones a distancia revise cuidadosamente los
procesos,
operaciones,
cálculo en la obtención de cada una de estas
medidas centrales y las de
dispersión. Por lo tanto los siguientes ejercicios
muestran el cálculo de estas medidas en los
tres tipos de series que se nos puede presentar.
Para asegurarnos de llegar a resultados
correctos aplique las fórmulas que plantea su texto
básico y /o esta guía didáctica así comprobará que
las soluciones
obtenidas por Ud. son correctas o incorrectas. Una
forma de operar en el cálculo sería por
ejemplo:
a) Serie Simple
Tipo(I)
Medidas centrales
Mdn =N/2= 7/2 = 3.5(corresponde a 95) Mo (
No hay)
Medidas de
dispersión
Rango = VM-Vm 98 – 92 = 6
b) Serie de frecuencias Tipo
(II)
Medidas centrales
Mdn=N/2= 40/2 = 20 17 Mo = 16
Para el Modo(a) observe en el cuadro que la
mayor frecuencia es 12 y que corresponde a la
variable 16. En cambio en el
caso anterior no existe puesto que no hay casos que
se repiten.
Medidas de
dispersión
Rango = VM-Vm 20 -15 = 5
c) Serie de intervalos o Tipo
(III)
FÓRMULAS:
Medidas de tendencia
central
Medidadas de
dispersión
Resumen de las medidas de
dispersión
Las cuatro pricipales medidas de
dispersión son:
1. El recorrido. Es la menos estable de las
cuatro medidas. Su utilización es limitada, excepto cuando
se haya de actuar con rapidez, o en situaciones sencillas, como
en la realización de una distribución
de frecuencias.
2. La desviación media. Se puede utilizar, junto
con la media, en una distribución normal. Hace tiempo, era
un estadígrafo muy empleado, pero hoy en día se ha
sustituido por la desviación típica.
3. La varianza es el cuadrado de la
desviación típica
4. La desviación típica. Es el
estadígrafo de dispersión más fiable y el
que con más frecuencia se emplea. Está asociado a
la media y se utiliza, en particular, en todo estudio o interpretación relacionado con la
distribución normal. Como veremos, la
desviación típica tiene muchas aplicaciones en toda
la estadística moderna y es una de las herramientas
más importantes de que se dispone.
Así mismo recuerde que las medidas
de variabilidad permiten conocer la intensidad con
que los valores se ubican alrededor de un valor medio. Para
ello consideramos el cálculo de la mediana
para estas medidas: ya sean cuartiles, deciles,
percentiles.
Por ejemplo si queremos obtener el Cuartil
2.
Recurrimos a la fórmula:
Lógico como podemos apreciar
coincide este cuartil con el valor de la Mda.
FORMULARIO DE ESTADÍSTICA
DESCRIPTIVA
A o R = VM – Vm i = ls – li + 1
fr = f/N
S2 =
V=
Evaluación
final de estadística descriptiva
CIENCIAS
ADMINISTRATIVAS
NIVEL 2
FECHA: 28 DE MARZO 2009
PROFESOR: ING. GERARDO GONZÁLEZ
M.
TEMAS:
1. Como estadístico residente de Pigs
and People (P & P) Airlines, el director de la
división de análisis estadístico le pide
recolectar y agrupar los datos sobre el número de
pasajeros que han decidido viajar con P&P. Tales datos
correspondientes a los últimos 50 días aparecen
en la siguiente tabla.
68 71 77 83 79
72 74 57 67 69
50 60 70 66 76
70 84 59 75 94
65 72 85 79 71
83 84 74 82 97
77 73 78 93 95
78 81 79 90 83
80 84 91 101 86
93 92 102 80 69
a) Realice la tabla de distribución de
frecuencia con 6 clases. ¿Está trabajando con
datos continuos o discretos?b) Construya un Histograma, Polígono de
frecuencia y Ojiva
2) Su firma esta introduciendo un nuevo chip de computador del
cual se promociona que realiza cálculos
estadísticos mucho más rápidamente que los
que actualmente se encuentran en el mercado. Se hacen
20 cálculos diferentes, produciendo los tiempos en
segundos que se ven más adelante. Aunque usted no puede
tergiversar su producto, usted desea presentar los resultados de
la manera más favorable para su empresa.
Determine la media, la mediana y la moda.
3.2 4.1 6.3 1.9 0.6 5.4 5.2 3.2 4.9 6.2
1.8 1.7 3.6 1.5 2.6 4.3 6.1 2.4 2.2 3.3
EVALUACION FINAL DE ESTADÍSTICA
DESCRIPTIVA
CIENCIAS
ADMINISTRATIVAS
NIVEL 2
FECHA: 19 DE JULIO 2009
PROFESOR: ING. GERARDO GONZÁLEZ
M.
TEMAS:
2. Los siguientes datos son los ingresos de 60
ejecutivos de marketing para empresas de Estados Unidos. Los
datos están expresados en ,iles de
dólares.
58 76 89 45 67 34
64 76 34 65 45 39
79 74 56 71 85 87
74 38 69 79 61 71
69 62 56 38 69 79
71 54 31 69 62 39
65 79 47 46 77 66
55 75 62 57 77 36
73 72 64 69 51 50
40 50 74 61 69 73
c) Realice la tabla de distribución de
frecuencia con n clases. ¿Está trabajando con
datos continuos o discretos?d) Construya un Histograma, Polígono de
frecuencia y Ojiva
2) Su firma esta introduciendo un nuevo chip de
computador del cual se promociona que realiza cálculos
estadísticos mucho más rápidamente que los
que actualmente se encuentran en el mercado. Se hacen 20
cálculos diferentes, produciendo los tiempos en segundos
que se ven más adelante. Aunque usted no puede tergiversar
su producto, usted desea presentar los resultados de la manera
más favorable para su empresa. Determine la media, la
mediana y la moda.
52 43 30 38 30 42 12 46 39 37
34 46 32 18 41 5
EVALUACION FINAL DE ESTADÍSTICA
DESCRIPTIVA
CIENCIAS
ADMINISTRATIVAS
NIVEL 2
FECHA: 19 DE JULIO 2009
PROFESOR: ING. GERARDO GONZÁLEZ
M.
TEMAS:
3. Los siguientes datos son los ingresos de 60
ejecutivos de marketing para empresas de Estados Unidos. Los
datos están expresados en ,iles de
dólares.
58 76 89 45 67 34
64 76 34 65 45 39
79 74 56 71 85 87
74 38 69 79 61 71
69 62 56 38 69 79
71 54 31 69 62 39
65 79 47 46 77 66
55 75 62 57 77 36
73 72 64 69 51 50
40 50 74 61 69 73
e) Realice la tabla de distribución de
frecuencia con n clases. ¿Está trabajando con
datos continuos o discretos?f) Construya un Histograma, Polígono de
frecuencia y Ojiva
2) Su firma esta introduciendo un nuevo chip de
computador del cual se promociona que realiza cálculos
estadísticos mucho más rápidamente que los
que actualmente se encuentran en el mercado. Se hacen 20
cálculos diferentes, produciendo los tiempos en segundos
que se ven más adelante. Aunque usted no puede tergiversar
su producto, usted desea presentar los resultados de la manera
más favorable para su empresa. Determine la media, la
mediana y la moda.
52 43 30 38 30 42 12 46 39 37
34 46 32 18 41 5
Autor:
Carlos Alarcón
Página anterior | Volver al principio del trabajo | Página siguiente |