Distribución de frecuencias – Proceso de tabulación de la información (página 2)
Escalas
de medición:
Corresponde a la Situación
1, es decir, es una escala en
que se establece un número determinado de clases o
categorías de tal modo que cada elemento de la
población pertenece a una y sólo
una clase.
Matemáticamente se dice que se ha establecido una
relación de equivalencia entre los elementos de la
población. Si sólo existen dos clases se
denomina escala dicotómica. La única
operación matemática que se puede realizar con
las clases de cualquier escala nominal es determinar las
cantidades de elementos que les corresponden determinar sus
frecuencias.
Por ejemplo:
- Sexo: las clases son masculino o
femenino. - Especialidad: las diferentes
especialidades (carreras) del CRUSAM. - Número de cedula de identidad personal.
- Temperatura de una persona: sanguíneo,
flemático, melancólico,
colérico. - Número de placa de
automóviles del país.
- Escala Nominal:
Corresponde a la Situación
1, es decir, es una escala en que se
establece un número determinado de clases o
categorías de tal modo que cada elemento de la
población pertenece a una y sólo una clase.
Matemáticamente se dice que se ha establecido una
relación de equivalencia entre los elementos de la
población. Si sólo existen dos clases se
denomina escala dicotómica. La única
operación matemática que se puede realizar con
las clases de cualquier escala nominal es determinar las
cantidades de elementos que les corresponden determinar sus
frecuencias.
Por ejemplo:
- Sexo: las clases son masculino o
femenino. - Especialidad: las diferentes
especialidades (carreras) del CRUSAM. - Número de cedula de identidad
personal. - Temperatura de una persona:
sanguíneo, flemático, melancólico,
colérico. - Número de placa de
automóviles del país.
- Escala Ordinal:
Corresponde a la Situación 2.
Es una escala nominal entre cuyas clases está
definido un orden, de modo que cualquiera que sean dos de
ellas, una será mayor o superior, en algún
sentido, que la otra.
Por ejemplo:
- Evaluaciones en un examen: 5, 4, 3
y 2. - Grado de satisfacción de una
necesidad: alto, medio, bajo - Conocimiento de un idioma:
excelente, bien, regular, mal
- Escala de Intervalos:
Corresponde a la situación 3
y no es más que una escala ordinal con una
distancia, una unidad de medida entre sus clases de modo tal
que dado dos puntajes cualesquiera se puede saber cuan
distante está uno del otro. La unidad de medida es
arbitraria, pero común y el punto de inicio (cero) es
también arbitrario.
Cuando se tiene una escala de intervalo se pueden
realizar las operaciones
de adición y sustracción, pero no
necesariamente la multiplicación y división
dentro de la escala.
Por ejemplo:
- La temperatura del aire. (caluroso, fresco, agradable,
etc.)
- Escala de Razones:
Corresponde a la situación 4 y
es una escala de intervalos donde existe un cero absoluto
que marca la
ausencia total del atributo en estudio.La
proporción entre los atributos de dos individuos
cualesquiera es independiente de la escala de medida
utilizada. En ella la razón entre dos clases
(puntajes) cualesquiera permanece invariable ante toda la
transformación de la escala de razón, o sea
ante toda transformación del tipo y=Φ(x). De
aquí que siempre el cero de la escala transformada
coincide con el cero de la escala original.
En las escalas de razones es posible realizar todas
las operaciones aritméticas con los
puntajes.
Por ejemplo:
- Estatura de los alumnos: la
estatura en metros es proporcional a la estatura en
pulgadas. - Peso de los alumnos: (en libras o
kilogramos) - El tiempo
invertido en una prueba de velocidad en educación física (en minutos o
segundos).
La
representación de los datos:
FRECUENCIAS.
Cuando se reúne gran cantidad de datos
primarios es útil distribuirlos en clases y
categorías y determinar las frecuencias
de las clases, o sea, el número de elementos
que pertenecen a una clase. El ordenamiento tabular de los
datos por clases conjuntamente con las frecuencias de clases
se denomina distribución de
frecuencias
El caso que se describe a continuación,
variables
discretas se denomina distribución por conteo de valores
individuales. Supongamos que un determinado colectivo,
representado por la variable estadística
Xi, que para mayor sencillez
consideraremos como unidimensional; sean los datos de esta
variable (representativo cada uno de ellos de un suceso)
X1, X2, … ,
Xn (supuesto que sean n
los
valores de la variable considerada.)
Definiremos como frecuencia de
un dato el número de veces que este aparece en el
colectivo; consecuentemente, si una variable
estadística toma r valores, cada uno de
los cuales puede repetirse un cierto número de veces,
podríamos decir que el número de datos
representado por la variable serían N,
siendo N la suma de las respectivas frecuencias de cada dato
(N=ΣXi).
Este valor
N será denominado como frecuencia
total, mientras que la frecuencia de cada dato
recibirá el nombre de frecuencia
absoluta o simplemente frecuencia
(fi). La frecuencia absoluta nos habla del
número de veces que un dato aparece en un
colectivo, más ello no nos dice
demasiado en orden al establecimiento de comparaciones sobre
la importancia de este dato. Para obtener una idea de la
importancia que un dato posee en el seno de un colectivo,
puesto que no es suficiente concepto de
frecuencia, se utiliza el concepto frecuencia
relativa, que se definirá como: el
coeficiente entre la frecuencia absoluta del dato considerado
y la frecuencia total
(fr=fi/ΣXi).
Para efectos prácticos, asumiremos las
siguientes definiciones de frecuencias:
- frecuencias absolutas : es el
número de veces que aparece en la muestra
dicho valor de la variable y se representa por
fi. - frecuencias relativas: es el
cociente entre la frecuencia absoluta y el tamaño de
la muestra. La denotaremos por
fri - frecuencias absoluta acumulada:
para poder
calcular este tipo de frecuencias hay que tener en cuenta
que la variable estadística ha de ser cuantitativa o
cualitativa ordenable. En otro caso no tiene mucho sentido
el cálculo de esta frecuencia. La
frecuencia absoluta acumulada de un valor de la variable,
es el número de veces que ha aparecido en la muestra
un valor menor o igual que el de la variable y lo
representaremos por fa, se puede acumular, en
la tabla estadística) en orden ascendente (fa↑)
o descendente (fa↓). - frecuencia relativa acumulada: al
igual que en el caso anterior se calcula como el cociente
entre la frecuencia absoluta acumulada dividido por el
tamaño de la muestra (N) y la denotaremos por
fra.
Resumiendo lo expuesto, si Xi es un
valor de la variable, podemos representar por fi a
su frecuencia y por
fi/ΣXi
a su frecuencia relativa (siendo
ΣXi=N o la
frecuencia total). Para el conjunto de los valores de la
variable Xi tendríamos, así la tabla
#1, compresiva de la información sobre dicha variable, a
través de las respectivas
frecuencias:
Tabla #1: Variables
Discretas
Valores de la variable (datos) | frecuencias fi | frecuencias fi/N |
X1 | f1 | f1/N |
X2 | f2 | f2/N |
… | … | … |
… | … | … |
Xn | fn | fn/N |
Donde:
N=Σfi y
Σfi/N=1
Otro es el caso de las clases representadas en forma
de intervalos, variables continuas, llamados intervalos
de clases que poseen extremos llamados limite
inferior y limite superior, Un intervalo se dice que es
abierto o no cerrado, por un extremo si no contiene el
límite correspondiente.
La longitud, tamaño o amplitud de un
intervalo de clases (C) es la diferencia entre los limites
superior e inferior (C=lim sup – lim inf). El Recorrido
(R) es la diferencia entre el dato mayor y el menor del
conjunto da datos en estudio (R=Xn –
X1)
En el caso de variables continuas será
necesario fijar intervalos de frecuencias para llegar a un
resumen efectivo de la información original. A menudo es
necesario representar una clase, o más particularmente,
un intervalo por un único valor, este
representará a todo el intervalo y se denominará
marca de clases. Matemáticamente el
punto medio de cada intervalo corresponde a lo
que denominamos marca de clase, se
denotará por Xi, y
constituirá el valor representativo de cada
intervalo. El número de observaciones que
correspondan a cada intervalo se denominará
frecuencias absolutas.
Tabla #2: Variables
Continuas
Intervalos (C) | Marcas de Xi | Frecuencias fi |
X1-X2 | X1 | f1 |
X2-X3 | X2 | f2 |
… | … | … |
… | … | … |
Xn-1-Xn | Xn | fn |
Donde
N = Σfi
= Número de observaciones
C = X’ – X"
= Amplitud del intervalo
Por último, en el caso de variables no
mensurables, dicha tabla adoptará una forma como la
siguiente:
Tabla #3: Variable
Ordinales
Variable | Frecuencias |
Característica | fA |
Característica | fB |
… | … |
… | … |
Característica | fZ |
A = ( X1,
X2, … , Xn
)- Efectuar el arreglo ordenado (Ascendente o
Descendente) de la población o muestra - Obtener la frecuencia absoluta mediante la
tabulación o conteo de los datos (homogenizar los
datos)R = (valor mayor –
valor menor) = Xn –
X1 - Encontrar el rango o recorrido (R) de los
datos: - Encontrar el número de clases o intervalos
de clases (K). El número de clases debe ser tal que se
evite el detalle innecesario, pero que no conduzca a la
perdida de más información de la que puede ser
convenientemente ignorada. Para este cálculo se
utiliza la formula de Sturges
K = 1 + 3.322(log.
N)
5- Determinar la amplitud de la clase ( C
):
R
C = ——–
K
Nota: el resultado siempre se
aproxima al siguiente entero si excede al número
entero obtenido, no importa el monto de la fracción
excedida al entero
˜ C = se lee "se aproxima
a…"
- El dato menor (X1)
será el limite inferior de la primera
clase. A él se le suma C y se obtiene el
limite superior de la primera clase que
también será el limite inferior de la segunda
clase. Luego se suma nuevamente C y se obtiene el limite
superior del segundo intervalo e inferior del tercero. Y
así sucesivamente hasta que el limite superior
corresponda o supere ligeramente el valor mayor (
Xn ), la cantidad de clases obtenidas
deberá corresponder con el número K calculado
mediante la formula de Sturges. - Una vez construidos los intervalos se calculan,
mediante tabulación de acuerdo a los limites
inferiores y superiores de las clases, las frecuencias
absolutas, relativas, porcentuales y acumuladas
correspondientes. - Con los datos obtenidos se procede a construir la
tabla de distribución de frecuencia.
Una de los primeros pasos que se realizan en
cualquier estudio estadístico es la tabulación
de resultados, es decir, recoger la información de la
muestra resumida en una tabla, que denominaremos
distribución de frecuencias, en la que
cada valor de la variable se le asocian determinados
números que representan el número de veces que
ha aparecido, su proporción con respecto a otros
valores de la variable, etc.
Por tanto, llamaremos distribución de
frecuencias a un agrupamiento de datos en
clases acompañada de sus frecuencias:
frecuencias absolutas, frecuencias relativa o
frecuencia porcentuales. En caso de que las variables
estén al menos en escala ordinal aparecen
opcionalmente las frecuencias acumuladas absolutas, y
frecuencias acumuladas porcentuales. Las
distribuciones de frecuencias varían en dependencia si
corresponden a una variable discreta o a una
variable continua.
Ejemplo #1: Variable
Continua:
La tienda CABRERA’S Y ASOCIADOS
estaba interesada en efectuar un análisis de sus cuentas
por comprar. Uno de los factores que más interesaba a
la
administración de la tienda era el de los saldos
de las cuentas de crédito. Se escogió al azar una
muestra aleatoria de 30 cuentas y se anotó el saldo de
cada cuenta (en unidades monetarias) como sigue:
77.97 13.02 17.97 89.19 12.18
8.15 34.40 43.13 79.61 90.99
43.66 29.75
7.42 93.91 20.64 21.10 17.64 81.59 60.94 43.97
32.67 43.66 51.69 53.40 68.13 11.10 12.98 38.74 70.15 25.68
Solución:
A= ( 7.42, 8.15, …,
…, …, 90.99, 93.91 )donde: X1 = valor mínimo =
7.42Xn= valor máximo =
93.91- Efectuar el arreglo ordenado de la población o
muestra:R = valor mayor – valor menor =
Xn – X1 = 93.91 – 7.42 =
86.49 - Encontrar el rengo o recorrido de los datos:
"R"K=1+3.322(log
N)Nota: en el ejemplo en estudio N=30 por cuanto que
son 30 clientes
en la muestra:K = 1 + 3.322 (log 30)
= 1 + 3.322 (1.477) el log fue obtenido
según calculadora= 1+ 4.9069
= 5.9069 ~6 aproximado al siguiente
entero - Encontrar en número de clases
"K" , según la fórmula de
Sturges: - Determinar la amplitud de la clase:
"C"
Nota: obsérvese que se va a trabajar con una
cifra significativa más cómoda, o
sea como los datos están dados en centésimos,
se calculo C hasta los milésimos para evitar que
algún dato coincida con el límite de
clases
Clases | P.M. Xi | fi | fr | fa↓ | fa↑ | fra↓ | fra↑ |
7.420 – 21.835 | 14.628 | 10 | 0.33 | 10 | 30 | 0.33 | 1.00 |
21.835 – | 29.043 | 4 | 0.13 | 14 | 20 | 0.46 | 0.67 |
36.250 – | 43.458 | 5 | 0.17 | 19 | 16 | 0.63 | 0.54 |
50.665 – | 57.873 | 3 | 0.10 | 22 | 11 | 0.73 | 0.37 |
65.080 – | 72.288 | 3 | 0.10 | 25 | 8 | 0.83 | 0.27 |
79.495 – | 86.703 | 5 | 0.17 | 30 | 5 | 1.00 | 0.17 |
Total | XXX | 30 | 1.00 | XXX | XXX | XXX | XXX |
Simbología
utilizada:
XI = Punto medio o marca
de clases
fi = frecuencia
absoluta
fr = frecuencia relativa
fa↓ = frecuencia absoluta
acumulada descendente
fa↑ = frecuencia absoluta
acumulada ascendente
fra↓ = frecuencia relativa
acumulada descendente
fra↑ = frecuencia relativa
acumulada ascendente
Nota:
- Obsérvese que el límite
inferior de la primera clase es el valor mínimo (
X1=7.42 ) y el límite superior es el
resultado de X1+C = 7.42+14.415 =
21.835. - El límite inferior de la siguiente
clase es igual al límite superior de la clase
anterior y el límite superior es el resultado de
adicionarle nuevamente la amplitud de la clase ( C
). - Obsérvese que el límite
superior de la última clase es igual al valor mayor
( Xn=93.91 )
Representaciones Gráficas de la Distribución
de Frecuencias
- Los Cuadros
estadísticos:
La estadística es una disciplina
que nos enseña a organizar los datos recogidos para
poder analizar sus características y posteriormente
inferir, a partir de las muestras tomadas, las
características de la población investigada.
Los cuadros o tablas corresponden a arreglos
sistemáticos de los datos por filas y columnas y son
un buen complemento del texto en
los informes
El primer procedimiento
estadístico consiste en tabular los datos según
el tipo de escala de medición utilizada. La
tabulación de los datos conlleva a representar la
información a través de tablas que de forma
general contiene las siguientes partes
fundamentales:
- Numeración (siempre que se
presenten dos o más cuadros) - Título: es la descripción que precede al cuadro, la
cuál deberá estar redactada en forma breve y
clara, de tal manera que exprese su contenido, siguiendo el
ordenamiento del mismo. Es necesario abarcar las
características: Qué, Dónde,
Cómo y Cuándo - Encabezamiento: se refiere al
número de atributos o variables que se quieren
representar en el cuadro y se anotan como denominaciones de
las columnas y subcolumnas; puede ser unidimensional,
bidimensonial o multidimensional. Los títulos de las
columnas van en mayúsculas y los subtítulos
en minúsculas - Cuerpo: es el conjunto de columnas
y líneas que contiene el cuadro en orden vertical y
horizontal, donde se colocan los datos sobre los hechos
observados - Pie: se refiere a la
información adicional necesaria a saber: notas,
llamadas, fuentes de
información y otras. Se anotan en el espacio
debajo de la línea inferior que limita el cuerpo del
cuadro.
- Los Gráficos
Estadísticos:
El gráfico es quizás el auxiliar
más valioso y utilizado para expresar datos
estadísticos, este elemento no le añade novedad
a las tablas o cuadros estadísticos, es de
fácil comprensión y accesible a un
número mayor de usuarios. El gráfico
además de expresar visualmente los hechos más
importantes de la información numérica, permite
una mejor y más fácil comprensión y
ahorra tiempo y esfuerzo en el análisis de datos
estadísticos al facilitar su apreciación visual
en forma conjunta:
-Histogramas de
frecuencias:
Un histograma es un gráfico que sirve para
representar una distribución de frecuencias. Este
gráfico está formado por un conjunto de
rectángulos (caso de variables continuas) que tienen
como base un eje horizontal (generalmente el eje de las
abscisas o de las X), y como centro los puntos medios
de las clases. Los anchos de las clases y las áreas
de los rectángulos son proporcionales a las
frecuencias de las clases. En el caso de las variables
discretas el gráfico consiste de un conjunto de
barras verticales en lugar de rectángulos,
hallándose cada barra sobre la observación respectiva y con una
altura proporcional a la frecuencia de la
observación
– Polígono de
frecuencias:
El polígono de frecuencias
es un gráfico formado por líneas quebradas,
que tiene los centros de las clases representadas en un eje
horizontal (eje de las X) y las frecuencias de las clases
en un eje vertical (eje de las Y). La frecuencia
correspondiente a cada centro de clase se señala
mediante un punto y luego los puntos consecutivos se unen
por líneas rectas. Del correspondiente histograma se
puede lograr el polígono de frecuencia uniendo los
puntos medios de las bases superiores de cada
rectángulos mediante líneas
rectas.
-Ojivas:
Las ojivas se refieren a los gráficos que
se construyen utilizando una distribución
acumulativa de frecuencias, el orden de acumulación
se aplica al cuadro de distribución de frecuencia y
puede ser descendente (fa↓, fra↓) o ascendente
(fa↑, fra↑). La figura que se forma al unir los
puntos del polígono de frecuencias acumulativas es
lo contrario del orden anunciado (por ejemplo si se
utilizó el orden descendente en la
acumulación de los datos en el cuadro, la ojiva
resulta ser ascendente).
LABORATORIO
(Resolver y entregar en grupos de tres
estudiantes, equivalen a nota de un parcial)
Problema #1: Variable
Continua
En la siguiente tabla se
presentan los pesos de 40 estudiantes de la Universidad
de Panamá,
con una aproximación de una libra.
138 | 164 | 150 | 132 | 144 | 125 | 149 | 157 |
146 | 164 | 140 | 147 | 136 | 148 | 152 | 144 |
168 | 126 | 138 | 176 | 163 | 118 | 154 | 165 |
146 | 173 | 142 | 147 | 135 | 153 | 140 | 135 |
161 | 145 | 135 | 142 | 150 | 156 | 145 | 126 |
- Construya una tabla de distribución de
frecuencias, indicando las frecuencias absolutas,
relativas, absolutas acumuladas y relativas
acumuladas. - Construya un histograma, un polígono de
frecuencias y una ojiva de la
distribución.
Problema #2: Variable
Discreta:
Una encuesta
entre un grupo de
madres-solteras, para analizar los problemas
económicos que enfrentan, en determinada comunidad;
arrojó los siguientes resultados acerca del
número de niños
en el hogar.
1 | 4 | 2 | 3 | 5 | 3 | 5 | 3 | 3 | 5 |
1 | 1 | 2 | 1 | 4 | 1 | 2 | 1 | 4 | 1 |
2 | 1 | 1 | 2 | 1 | 2 | 3 | 2 | 3 | 3 |
3 | 1 | 3 | 4 | 1 | 1 | 3 | 5 | 4 | 2 |
2 | 5 | 1 | 4 | 2 | 3 | 1 | 2 | 5 | 1 |
- Construya una tabla de distribución de
frecuencias y sus respectivas representaciones
gráficas.
Problema #3:
Una compañía de
transmisiones electrónicas registro como
sigue el número de recibos de servicios
prestados por cada una de sus 20 sucursales en el último
mes:
808 | 641 | 628 | 731 | 641 | 446 | 342 | 545 | 910 | 568 |
335 | 459 | 727 | 848 | 229 | 347 | 309 | 649 | 575 | 757 |
La compañía piensa que una tienda
realmente no puede esperar alcanzar financieramente el punto de
equilibrio con menos de 456 servicios prestados
mensualmente. Además su política es dar un
bono financiero al gerente que
genere más de 683 servicios al mes. Disponga los datos
en una arreglo e indique cuántas sucursales no
están consiguiendo el punto de equilibrio y
cuántas ganan el bono.
Problema #4:
Una agencia de viajes
ofrece precios
especiales en ciertas travesías por el Caribe. Planea
ofrecer varios de estos paseos durante la próxima
temporada invernal en el hemisferio norte y desea enviar
folletos a posibles clientes. A fin de obtener el mayor
provecho por cada unidad monetaria gastada en publicidad,
necesita la distribución de las edades de los pasajeros
de travesías anteriores. Se consideró que si
participaban pocas personas de un grupo de edad en los paseos
no sería económico enviar un gran número
de folletos a personas de ese grupo de edad. La agencia
seleccionó una muestra de 40 clientes anteriores de sus
archivos y
se registró sus edades, como sigue:
77 | 18 | 63 | 84 | 38 | 54 | 50 | 59 |
54 | 56 | 36 | 50 | 50 | 34 | 44 | 41 |
58 | 58 | 53 | 62 | 62 | 43 | 52 | 53 |
63 | 62 | 62 | 61 | 61 | 52 | 60 | 60 |
45 | 66 | 83 | 63 | 63 | 58 | 61 | 71 |
- Organice los datos en una tabla de
distribución de frecuencias de las edades de los
clientes en la muestra - ¿Cuál grupo de edad presenta la
mayor frecuencia relativa? ¿Cuál la menor
frecuencia relativa?. - Saque conclusiones que puedan ayudar a la agencia
a planear una campaña de publicidad para los paseos
invernales.
BIBLIOGRAFÍA
Caballero , Wilfredo Introducción a la
Estadística
Serie Libros y
Materiales
Educativos N° 28
I edición. San José, Costa
Rica
IICA, 1981
Carrasquilla E. Pedro Manual para
la confección de gráficos
estadístico
DEC-CGR, Dirección de Estadísticas y Censos
Panamá. República de
Panamá.
DEC-CGR Manual para la elaboración y
publicación de
Cuadros estadísticos (tercera
edición)
Dirección de estadística y
Censos.
Panamá. República de
Panamá.
Nuñez del Benavente Estadística
básica para planificación.
6ta.edición
Arturo Siglo XX! Editores S.A,
México. 1977
Autor:
Francisco Antonio Cabrera
González
f_cabrera51[arroba]hotmail.com
Graduado en mayo de 1980 de Economista-Organizador de
la Producción Agrícola y Master en
Ciencias
Económicas en la Academia Agrícola K. A.
Timiriazev de Moscú –Rusia.
Profesor de la Universidad de Panamá desde
1981. Ha ejercido la docencia
universitaria en los Centros Regionales de Azuero
(Chitré), Los Santos, Veraguas, Coclé y San
Miguelito. Catedratico (Profesor
Regular) desde 1991 del Departamento de Estadística
Económica y Social de la Facultad de Economía.
En su vida universitaria, como docente, ha sido
representante de los profesores del CRU-Azuero (Chitré)
ante el Consejo General Universitario -CGU (1990-1992),
Vicepresidente de la Asociación de Profesores de la
Universidad de Panamá –APUDEP (1991-1993),
Presidente de la APUDEP (1993-1995), Director del Centro
Regional Universitario de San Miguelito –CRUSAM
(1995-2000) y en la actualidad es docente investigador de la
Universidad de Panamá.
UNIVERSIDAD DE PANAMÁ
CENTRO REGIONAL UNIVERSITARIO DE SAN
MIGUELITO
FACULTAD DE ECONOMÍA
DEPARTAMENTO DE ESTADÍSTICA ECONÓMICO Y
SOCIAL
Curso: Est.115 : "Estadística
Económica I".
Página anterior | Volver al principio del trabajo | Página siguiente |