Ubicado en el Centro Comercial Regina
(CCR) –Puerto La Cruz.
- Bases
teóricas - Distribución de
frecuencias. - Medidas de tendencia
central. - Medidas de
posición. - Medidas de
dispersión. - Conclusión
- Bibliografía
Desde los comienzos de la civilización han
existido formas sencillas de estadística, pues ya se utilizaban
representaciones gráficas y otros símbolos en pieles,
rocas, palos de
maderas y paredes de cuevas para contar el número de
personas, animales o
ciertas cosas.
En nuestros días, la estadística se ha convertido en un método
efectivo para descubrir con exactitud los valores de
datos
económicos, políticos, sociales,
psicológicos, biológicos y físicos, y sirve
como herramienta para analizar y relacionar dichos datos.
La estadística se puede definir como un conjunto
de métodos
para manejar la recolección, presentación y
agrupación de los datos, así como del análisis, interpretación,
proyección e inferencia de ellos, y ayuda a resolver
problemas como
el diseño
de experimentos y la
toma de
decisiones.
En este trabajo se realizará un análisis estadístico de las edades
de las personas que asisten a Cines Unidos, ubicado en el Centro
Comercial Regina (CCR) – Puerto La Cruz, para el desarrollo de
este análisis se utilizará un conjunto de
mediciones estadísticas que hemos venido estudiando a
lo largo de toda la materia y que
ayudaran en el análisis de estos datos. Estas mediciones
serán:
- Distribución de Frecuencias.
- Medidas de Tendencia Central.
- Medidas de Posición.
- Medidas de Dispersión.
Estadística:
Se define como el conjunto de métodos
para manejar la obtención, presentación y
análisis de observaciones numéricas. Es la
recopilación, presentación y caracterización
de la información en fin de que se auxilie tanto
en el análisis de datos como en el proceso de la
toma de
decisiones.
Probabilística:
Es aquella que proporciona una base racional para tratar
de resolver situaciones influidas por factores
aleatorios.
Población:
Es el conjunto de los elementos sobre el cual realizamos
nuestro estudio. Es un conjunto de elementos con características comunes, que pueden ser
finitos o infinitos.
Muestra:
Es un conjunto de medidas, observaciones tomadas a
partir de una población dada.
Frecuencia:
Es el número de veces que se repite un valor, dato o
término dentro de una serie en estudio.
Tipos de frecuencias estadísticas:
- Frecuencia simple absoluta: es el
número de veces que se observa en un mismo ítem o
la cantidad de datos que caen en un mismo
intervalo. - Frecuencia simple relativa: es la razón
geométrica entre la frecuencia absoluta y el total de
datos, es decir el cociente de dividir el número de
veces que aparece un dato de un intervalo entre la totalidad de
datos que conforma la muestra de que
se trate. Su máximo será la unidad y su
mínimo será el cero. - Frecuencia acumulada: es la suma de la
frecuencia de un intervalo de clases con todas las frecuencias
de los intervalos que la preceden. - Frecuencia acumulada absoluta: es la evaluación o suma de todas las
frecuencias absolutas hasta el intervalo de la clase
considerado inclusive. - Frecuencia acumulada relativa: viene a ser la
acumulación de todas las frecuencias relativas hasta el
mismo intervalo considerado inclusive.
Variable:
Es la característica de interés
sobre cada elemento de una población o muestra y puede
tomar diferentes valores.
Variables estadísticas:
- Variable aleatoria: cuando los valores
que asume la variable han sido antecedidos por una selección aleatoria de los objetos
medidos o son resultados de algún proceso al
azar. - Variable continua: es aquella que
teóricamente puede tomar cualquier valor dentro
de un intervalo. - Variable discreta: es aquella que toma
valores
separados entre sí por alguna cantidad. - Variable cuantitativa: es aquella que asume
valores acompañados de una unidad de medida. - Variable cualitativa: es la que se refiere a
la clasificación, como estado
civil, preferencia por una marca,
etc.
Datos:
Son números o medidas que han sido recopilados
como resultado de observaciones. Los datos pueden provenir de
recuentos tales como el número de personas que laboran en
una empresa o
de mediciones como el peso de una persona.
Tipos de datos estadísticos:
- Datos simples: cuando a los datos no se les
han aplicado algún tratamiento de agrupación,
pudiendo ser dichas series:
- Sin frecuencias: cuando no se repiten los
valores. - Con frecuencias: cuando se repiten los
valores.
- Datos agrupados en clase: los datos se agrupan
en clases con el fin de sintetizar, condensar, resumir o hacer
más fácilmente manejable la información.
Las clases constan de un límite inferior
() y de un
limite superior ().
Tablas estadísticas:
Son aquellas que están formadas por la columna
matriz y el
cuerpo esta compuesto por más de una columna y se dividen
en simples y complejas.
Gráficos estadísticos:
Son datos cuantitativos que vienen representados por
dibujos
geométricos donde la longitud o el área de una
parte de la figura es proporcional a la cantidad o magnitud
representada.
Escala:
Es la asociación de cosas distintas pero de la
misma especie. Es el tamaño o proporción con el que
se desarrolla un plan de
ideas.
Tipos de escala:
- Escala nominal: es aquella en que los
números solo se emplean para diferenciar los objetos o
distintas categorías o cuando se emplean
nombres. - Escala ordinal: es aquella en la que los
números se utilizan para diferenciar de acuerdo con
ciertos criterios jerárquicos, como son los
números que empleamos para clasificar los distintos
extractos socioeconómicos o para designar
preferencias. - Escala de intervalos: es una escala
más especializada que la ordinal y la nominal en la cual
es posible ordenar las mediciones y decir también cuanto
difiere una situación de otra.
Es el conjunto de valores que puede presentar una
variable junto con sus frecuencias, estas se pueden clasificar de
acuerdo a sus tipos.
Según la naturaleza de la
variable estudiada las distribuciones de frecuencia pueden
ser:
- No agrupadas: se presentan cuando el
número de valores que puede presentar una variable no es
muy elevado y en ese caso podemos observar todos los valores de
esa variable. Este caso se presenta cuando la variable es
discreta y no presenta excesivos valores. - Agrupados en intervalos: se presenta cuando la
variable es continua o discreta pero con elevado número
de valores. Es esta situación se agrupan dichos valores
en intervalos o clases. Se llama amplitud del intervalo a la
distancia que existe entre los extremos de los intervalos de
clases.
Fila de datos:
Sirve para ordenar en forma creciente los datos de
acuerdo a su frecuencia. Se agrupan a partir del número
más pequeño de la muestra hasta el número
mayor.
n = número total de
datos
Rango:
Resulta de la diferencia entre el límite superior
y el límite inferior, existe en los datos no agrupados, se
expresa con la siguiente ecuación:
Número de clases:
Se expresa por la siguiente ecuación:
n° de clases =
Intervalo de clases:
Es el cociente que resulta de dividir el rango entre el
número de clases.
Punto medio ():
Es el valor promedio de cada intervalo de
clase.
Límites reales:
Es el resultado de restar 0,5 al límite inferior
de clases y luego sumar esa misma cantidad al límite
superior de clases.
Histograma de frecuencia:
Son segmentos de geometría
rectangular graficado con el intervalo de clases o los límites
reales de clase.
En el caso que se utilice la frecuencia simple se
graficaran histogramas simples y en el caso de que se utilicen
frecuencias acumuladas se graficaran histogramas
acumulados.
Polígonos de frecuencia:
Se obtienen de la unión de puntos obtenidos con
los puntos medios de cada
clase y su frecuencia simple o acumulada dependiendo del tipo que
se quiere graficar.
Es un valor, que es típico o representativo de un
conjunto de datos. Como tales valores tienden a situarse en el
centro del conjunto de datos ordenados según su
magnitud.
Se pueden definir varios tipos de medidas de tendencia
central, las más comunes son la media aritmética o
brevemente media, la mediana y la moda.
Media aritmética ():
La media aritmética o media de un conjunto de N
números se representa por y se define como:
Para datos no agrupados
Donde:
xi = cada uno de los datos.
n = número total de datos.
Para datos agrupados
Donde:
xi = punto medio.
fi = frecuencia simple relativa.
n = número total de datos.
Mediana ():
La mediana de una colección de datos ordenados en
orden de magnitud es el valor medio o la media aritmética
de los dos valores medios.
Para datos no agrupados
Para datos agrupados
Donde:
LI = frontera inferior de clase.
Linf fi = límite inferior de la franja
modal
fa = frecuencia acumulada anterior a la
clase total.
fi = frecuencia modal.
n = número total de datos.
Moda o modo ():
La moda de una
serie de números es aquel valor que se presenta con la
mayor frecuencia, es decir, es el valor más
común.
Para datos no agrupados
Es el valor que mas se repite dentro de la muestra de
datos.
Para datos agrupados
Donde:
LI = frontera inferior de clases.
A1 = fi – fi
ant
fi ant = frecuencia modal anterior
fi post = frecuencia modal
posterior.
Ic = intervalo de clases.
A2 = fi – fi
post
Son indicadores
usados para señalar que porcentaje de datos dentro de una
distribución de frecuencias superan estas
expresiones, cuyo valor representa el valor del dato que se
encuentra en el centro de la distribución de frecuencia, por lo que
también se les llama " Medidas de Tendencia Central
".
Pero estas medidas de posición de una
distribución de frecuencias han de cumplir determinadas
condiciones para que lean verdaderamente representativas de la
variable a la que resumen. Toda síntesis
de una distribución se considerara como operativa si
intervienen en su determinación todos y cada uno de los
valores de la distribución, siendo única para cada
distribución de frecuencias y siendo siempre calculable y
de fácil obtención. A continuación se
describen las medidas de posición más comunes
utilizadas en estadística, como lo son:
- Cuartiles: Hay 3 cuartiles que dividen a una
distribución en 4 partes iguales: primero, segundo y
tecer cuartil. - Deciles: Hay 9 deciles que la dividen en 10
partes iguales: (primero al noveno decil). - Percentiles: Hay 99 percentiles que dividen a
una serie en 100 partes iguales: (primero al noventa y nueve
percentil).
Cuartiles (Q1, Q2,
Q3)
a) Primer cuartil (Q1):
Aquel valor de una serie que supera al 25% de los datos
y es superado por el 75% restante.
Formula de Q1 para series de Datos
Agrupados en Clase.
Donde:
:
posición de Q1, la cual se localiza en la
primera frecuencia acumulada que la contenga, siendo la clase de
Q1, la correspondiente a tal frecuencia
acumulada.
Li, faa, fi,
Ic : idéntico a los conceptos vistos para
Mediana pero referidos a la medida de la posición
correspondiente.
b) Segundo cuartil (Q2):
Coincide, es idéntico o similar al valor de la
Mediana (Q2 = Md). Es decir, supera y es
superado por el 50% de los valores de una Serie.
c) Tercer cuartil (Q3):
Aquel valor, termino o dato que supera al 75% y es
superado por el 25% de los datos restantes de la
Serie.
Formula de Q3 para series de Datos Agrupados
en Clase.
Donde:
:
posición de Q3, todo idéntico al calculo
de la Mediana.
Deciles (D1, D2, …
D9)
Primer Decil (D1), Quinto Decil
(D5) y Noveno Decil (D9).
El primer decil es aquel valor de una serie que supera a
1/10 parte de los datos y es superado por las 9/10 partes
restantes (respectivamente, hablando en porcentajes, supera al
10% y es superado por el 90% restante).
El D9 (noveno decil) supera al 90% y es
superado por el 10% restante.
- Como se observa, son formulas parecidas a la del
calculo de la Mediana, cambiando solamente la respectivas
posiciones de las medidas.
Percentiles (P1, P2, …
P99)
Primer Percentil (P1), Percentil 50
(P50) y Percentil 99 (P99).
El primer percentil supera al uno por ciento de los
valores y es superado por el noventa y nueve por ciento
restantes.
Formulas de P1,
P50, P99 para series de Datos Agrupados en
Clase.
El P99 (noventa y nueve percentil) supera al
99% de los datos y es superado a su vez por el 1%
restante.
- Idénticas formulas al cálculo
de la Mediana, cambiando obviamente las correspondientes
posiciones de cada medida.
Para determinar estas medidas se aplicara el principio
de la mediana; así, el primer cuartil cereal valor por
debajo del cual se encuentra el 25 por ciento de los datos; bajo
el tecer cuartil se encuentra el 75 por ciento; el 80 decil
será el valor por encima del cual estará el 20 por
ciento de los datos, etc.
Como se observa, todas estas medidas no son sino casos
particulares del percentil ya que el primer cuartil no es sino el
25°
percentil, el tercer cuartil el 75° percentil, el cuarto decil
el 40°
percentil, etc.
Datos no agrupados:
Se hace difícil calcular estas medidas, sin
embargo, siguiendo los mismos principios
mencionados para la Mediana, se pueden localizar en la forma
siguiente:
Si tenemos una serie de valores X1,
X2, X3 … Xn, se localiza
el primer cuartil como el valor cuando n es par, y cuando n es impar. Para el tercer cuartil
será (n
par); (n
impar).
En caso de los textiles será o donde A representa el número del
textil.
Para los deciles será o siendo A el número del decil; y para los
percentiles o
.
Ejemplo:
En una serie de 32 términos se desea localizar el
4° sextil,
8° decil y
el 95°
percentil.
Esto significa que el 4° textil se encuentra localizado en el
termino numero 21, es decir, el que ocupa la 21° posición; el
8° decil se
encuentra localizado entre el termino numero 25° y 26° ; y el 95° percentil entre la
posición 30° y 31° .
Calculo para una distribución de
frecuencia
Para el cálculo de
esta medida en datos agrupados en una distribución de
frecuencia, se utiliza el mismo procedimiento
estudiado para el cálculo de la Mediana, el cual
es:
- Se efectúa la columna de las frecuencias
acumuladas. - Se determina la posición del término
cuyo valor se pretende calcular, en caso de ser el primer
cuartil será , si fuese el 95° centil … etc. - Se verifica cual es la clase que lo contiene; para
ello se utiliza la columna de las frecuencias
acumuladas. - Se hace la diferencia entre el número que
representa el orden de posición cuyo valor se pretende
calcular y la frecuencia acumulada de la clase anterior a la
que lo contiene. - Se calcula la medida solicitada de acuerdo a la
siguiente fórmula:
Donde:
1i: limite inferior de la clase que lo
contiene.
P: valor que representa la posición de la
medida.
fi: la frecuencia de la clase que contiene la
medida solicitada.
fa-1: frecuencia acumulada anterior a la que
contiene la medida solicitada.
Ic: intervalo de clase.
Ejemplo:
Determinación del primer cuartil, el cuartil
textil, el séptimo decil y el 30° percentil.
Salarios (I. de Clases) | N° de empleados (fi) | fa |
200 – 299 | 85 | 85 |
300 – 399 | 90 | 175 |
400 – 499 | 120 | 295 |
500 – 599 | 70 | 365 |
600 – 699 | 62 | 427 |
700 – 800 | 36 | 463 |
Estos resultados nos indican que el 25 por ciento de los
empleados ganan salarios por
debajo de Bs. 334; que sobre Bs. 519,51 ganan el 33,33 por ciento
de los empleados; que bajo 541,57 gana el 57 por ciento de los
empleados y sobre Bs. 359,88 gana el 70 por ciento de los
empleados.
Muchas veces necesitamos conocer el porcentaje de
valores que esta por debajo o por encima de un valor dado; lo que
representa un problema contrario al anterior, esto es, dado un
cierto valor en la abscisa determinar en la ordenada el tanto por
ciento de valores inferiores y superiores al valor dado.
Operación que se resuelve utilizando la siguiente formula
general:
Donde:
P: lugar percentil que se busca.
P: valor reconocido en la escala X.
fa-1: frecuencia acumulada de la clase
anterior a la clase en que esta incluida P.
fi: frecuencia de la clase que contiene a
p.
Li: limite inferior de la clase que contiene
a P.
Ic: intervalo de clase.
N: frecuencia total.
Ejemplo:
Utilizando la distribución anterior, determinar
que porcentaje de personas ganan salarios
inferiores a Bs. 450,00
El 50,75 por ciento de las personas ganan salarios
inferiores a Bs. 450.
Método gráfico para fraccionar la
distribución
Se pueden obtener en forma gráfica, a
través de la curva de la frecuencia acumulada
(ojiva).
Para ello basta después de trazar la ojiva,
llevar el orden de posición de la medida que se quiere
sobre la ordenada, trazar por ese punto una perpendicular toca a
la ojiva, baja una paralela a la ordenada hasta tocar la abscisa;
en el punto donde toque a dicho eje, se encontrará el
valor buscado.
Obtención gráfica de las medidas de
posición
Similar o idéntico a la distribución
grafica de la Mediana con la sola excepción de que se
llevaría al eje vertical (frecuencias acumuladas) las
especificas posiciones de cada indicador de posición en
particular.
Ejemplo:
Forma de obtener los indicadores de
posición (cuartiles, deciles y percentiles) para series de
datos agrupados en clases:
Supongamos la siguiente distribución de
frecuencias referidas a las estaturas que representaban 40
alumnos de un curso.
(I. de Clases) | Estaturas (mts) | N° alumnos (fi) | fa |
1,60 | 1,639 | 5 | 5 |
1,64 | 1,679 | 8 | 13 |
** 1,68 | 1,719 | 15 | ** 28 |
* 1,72 | 1,759 | 10 | 38 * |
1,76 | 1,80 | 2 | 40 |
Q3=?
La cual se ubica en la primera fa que la
contenga
Esta estatura de Q3 = 1,73 mts. Supera en la
distribución de frecuencia al 75% de los alumnos del curso
y es superada por el 25% de los mismos
D8 = ?
supera esta estatura de 1,736 mts a 8/10 partes de curso
y es superado por las 2/10 partes restantes.
P55 = ?
Esta estatura supera al 55% de los alumnos del curso y
es superada por el 45% restante.
Una medida del grado de variación de un conjunto
de valores de una variable estadística la proporciona el
propio rango o recorrido de la variable. Lo mas frecuente, sin
embargo, es describir esa variación mediante las
diferencias entre esos valores y alguna medida de tendencia
central. Para las variables
cuantitativas, las medidas de dispersión mas utilizadas
son la desviación media y la desviación
típica.
Desviación media
(DM):
Se conoce también como promedio de
desviación. Es igual a la media aritmética de las
desviaciones de una serie de valores respecto de su media
aritmética. Para una serie de N valores: X1,
X2, X3,… Xn, se define a
través de la siguiente expresión:
Desviación típica (S):
Se define como la raíz cuadrada positiva del
promedio aritmético de los cuadrados de los desvíos
con respecto a la medida aritmética y se considera como el
indicador de variación o dispersión más
importante.
Varianza (S2):
La varianza se define como el cuadrado de la
desviación típica. Su mayor utilidad se
presenta en la estadística inductiva. Se puede determinar
como una medida de variación promedio y se obtiene
dividiendo la variación total por el número de
medidas.
Coeficiente de variación
(CV):
Se define como el cociente que resulta de dividir la
desviación típica entre la medida aritmética
de la serie de
datos, multiplicado luego por cien para que su resultado venga
expresado en porcentaje.
Coeficiente de Shepeard
(CS):
Se define como el cociente que resulta de dividir el
intervalo de clases al cuadrado entre doce para luego restarlo
con la varianza para ser utilizado en las distribuciones cuando
ya se debe haber hecho un examen completo de la
situación.
Análisis Estadístico de
las Edades de las Personas que Asisten a Cines Unidos Ubicado en
el Centro Comercial Regina (CCR) – Puerto La
Cruz
Muestra de datos
31 33 40 32 22 23 32 21 20 16 22
24 18 20 15 18 20 10 21 39 17 15
13 16 54 18 11 37 45 19 37 15 40
19 27 37 19 51 21 30 34 11 34 46
14 23 36 42 43 26 41 26 42 14 30
15 16 26 35 33 23 17 46 17 35 29
Fila de datos
10 = 1 16 = 3 22 = 2 28 = 0
11 = 2 17 = 3 23 = 3 29 = 1
12 = 0 18 = 3 24 = 1 30 = 2
13 = 1 10 19 = 3 18 25 = 0 10 31 = 1 8
14 = 2 20 = 3 26 = 3 32 = 2
15 = 4 21 = 3 27 = 1 33 = 2
34 = 2 40 = 2 46 = 2 52 = 0
35 = 2 41 = 1 47 = 0 53 = 0 1
36 = 1 42 = 2 48 = 0 54 = 1
37 = 3 9 43 = 1 7 49 = 0 3
38 = 0 44 = 0 50 = 0 n = 66
39 = 1 45 = 1 51 = 1
n°
de clases =
=
n°
de clases = 7,04
Þ
Tabla de Distribución de
Frecuencias.
I. de clase | fi | fa | xi | fir | far | fir% | far% | Limites reales |
10 – 15 | 10 | 10 | 12,5 | 0,15 | 0,15 | 9,5 – 15,5 | ||
16 – 21 | 18 | 28 | 18,5 | 0,27 | 0,42 | 15,5 – 21,5 | ||
22 – 27 | 10 | 38 | 24,5 | 0,15 | 0,57 | 21,5 – 27,5 | ||
28 – 33 | 8 | 46 | 30,5 | 0,12 | 0,69 | 27,5 – 33,5 | ||
34 – 39 | 9 | 55 | 36,5 | 0,13 | 0,83 | 33,5 – 39,5 | ||
40 – 45 | 7 | 62 | 42,5 | 0,10 | 0,93 | 39,5 – 45,5 | ||
46 – 51 | 3 | 65 | 48,5 | 0,04 | 0,08 | 45,5 – 51,5 | ||
52 – 57 | 1 | 66 | 54,5 | 0,01 | 1 | 51,5 – 57,5 |
Polígono e Histograma de
Frecuencia Acumulada
Polígono e Histograma de
Frecuencia Simple
Medidas de Tendencia
Central
Medidas de Tendencia Central.
Para datos no agrupados
Þ
Para datos agrupados
I. de clase | fi | fa | xi | xi |
10 – 15 | 10 | 10 | 12,5 | 125 |
16 – 21 | 18 | 28 | 18,5 | 333 |
22 – 27 | 10 | 38 | 24,5 | 245 |
28 – 33 | 8 | 46 | 30,5 | 244 |
34 – 39 | 9 | 55 | 36,5 | 328,5 |
40 – 45 | 7 | 62 | 42,5 | 297,5 |
46 – 51 | 3 | 65 | 48,5 | 145,5 |
52 – 57 | 1 | 66 | 54,5 | 54,5 |
Þ
Þ
Þ Þ
Þ
Þ
Datos agrupados
I. de clases | fi | fa |
10 – 15 | 10 | 10 |
16 – 21 | 18 | 28 |
22 – 27 | 10 | 38 |
28 – 33 | 8 | 46 |
34 – 39 | 9 | 55 |
40 – 45 | 7 | 62 |
46 – 51 | 3 | 65 |
52 – 57 | 1 | 66 |
n = 66
Cuartiles:
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Deciles:
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Percentiles:
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
Þ
I. de clases | fi | xi | ||||
10 – 15 | 10 | 12,5 | 125 | 14,36 | 143,6 | 2062,096 |
16 – 21 | 18 | 18,5 | 333 | 8,36 | 150,48 | 1258,012 |
22 – 27 | 10 | 24,5 | 245 | 2,36 | 23,6 | 55,696 |
28 – 33 | 8 | 30,5 | 244 | 3,64 | 29,12 | 105,996 |
34 – 39 | 9 | 36,5 | 328,5 | 9,64 | 86,76 | 836,366 |
40 – 45 | 7 | 42,5 | 297,5 | 15,64 | 109,48 | 1712,267 |
46 – 51 | 3 | 48,5 | 145,5 | 21,64 | 64,92 | 1404,868 |
52 – 57 | 1 | 54,5 | 54,5 | 27,64 | 27,64 | 763,969 |
Þ
Þ
Þ
Þ
Þ
Þ
Þ Þ
Þ
Þ
Una ordenación tabular de los datos en clases,
reunidas las clases y con las frecuencias correspondientes a cada
una, se conoce como una distribución de frecuencias
o tabla de frecuencias. Los datos ordenados y resumidos,
se suelen llamar datos agrupados. Aunque en el proceso de
agrupamiento generalmente se pierde parte del detalle original de
los datos, tiene la importante ventaja de presentarlos todos en
un sencillo cuadro que facilita el hallazgo de las relaciones que
pueda haber entre ellos.
Para realizar una distribución de frecuencias se
deben seguir los siguientes procedimientos:
- Determinar la diferencia entre el mayor y el menor de
los datos registrados y así encontrar el
rango. - Dividir el rango entre el número de clases
para así obtener el intervalo de clases. - Sumar el límite inferior de clases con el
límite superior de clases y dividirlo entre dos para
así obtener los puntos medios. - Restarle 0,5 al límite inferior de clases y
luego sumarle esa misma cantidad al límite superior de
clases nos permite obtener los límites
reales.
Los histogramas y polígonos de frecuencia son dos
representaciones gráficas de las distribuciones de
frecuencias. Un histograma de frecuencia consiste
en una serie de rectángulos que tienen sus bases sobre un
eje horizontal (el eje x) con longitud igual al tamaño de
los intervalos de clase. Un polígono de
frecuencia es un gráfico de línea trazado
uniendo los puntos medios de los techos de los rectángulos
en el histograma.
Un promedio es un valor, que es típico a
representativo de un conjunto de datos. Como tales valores
tienden a situarse en el centro del conjunto de datos ordenados
según su magnitud, los promedios se conocen también
como medidas de tendencia central. Se pueden definir
varios tipos de medidas de tendencia central las mas comunes son
la media aritmética, la mediana y la moda.
Las medidas de
posición se usan para describir la posición
que tiene un valor de datos específicos en relación
con el resto de los datos. Las medidas de posición
más conocidas son los cuartiles, los percentiles y los
deciles. Un percentil es el valor sobre la escala
de medida, debajo del cual cae un porcentaje dado de los datos en
la distribución. Cuartiles son los valores de las
variables que
dividen en cuartos a los datos ordenados; cada conjunto de datos
posee tres cuartiles. El primer cuartil Q1, es
un número tal que cuando mucho el 25% de los datos es
menor en valor que Q1 y cuando mucho el 75% de los
datos es mayor que Q1. EL segundo cuartil es la
media. El tercer cuartil Q3, es un
número tal que cuando mucho el 75% de los datos es menor
en valor que Q3 y cuando mucho el 25% de los datos es
mayor que Q1. Deciles son valores de un
conjunto de datos que dividen el total de observaciones en diez
partes y no en cuatro, como los cuartiles, o en 100, como los
percentiles. Así entre los deciles se encuentra el quinto
decil (intervalo), que es otro nombre para la mediana. De todas
las medidas de dispersión las más empleadas son los
percentiles y los cuartiles.
Una medida del grado de variación de un conjunto
de valores de una variable estadística la proporciona el
propio rango o recorrido de la variable. Lo más frecuente,
sin embargo, es describir esa variación mediante las
diferencias entre esos valores y alguna medida de tendencia
central. Las medidas de
dispersión más utilizadas son la
desviación media, la desviación típica, la
varianza, el coeficiente de variación y el coeficiente de
Shepeard.
Armando, Soto Negrin. Principios de
Estadística. Editorial Panapo. 1999. Pág.:
71-81.
Ernesto, Rivas González. Estadística
General. Ediciones de la Biblioteca.
Caracas. 2000. Pág.: 164-169.
www.monografias.com
www.elrincondelvago.com
Rojas, Carlos.
Belda, María
PUERTO LA CRUZ