Primero definiré que es una tabla para luego
trabajar las diferentes clases de tablas pedidas:
Una tabla es un cuadro que consiste en la
disposición conjunta, ordenada y normalmente totalizada,
de las sumas o frecuencias totales obtenidos en la
tabulación de los datos, referentes
a las categorías o dimensiones de una variable o de varias
variables
relacionadas entre sí. Las tablas sistematizan los
resultados cuantitativos y ofrecen una visión
numérica, sintética y global del fenómeno
observado y de las relaciones entre sus diversas características o variables. En
ella, culmina y se concreta definitivamente la fase
clasificatoria de la investigación cuantitativa.
Teniendo la definición de lo que es una tabla,
podemos trabajar entonces cada uno de los tipos de tablas
pedidos:
- Tabla de entrada de datos: Es una tabla en la
cual solo aparecen los datos que se
obtuvieron de la investigación científica o del
experimento. Es la tabla más sencilla y se utiliza
cuando no se necesita mayor información acerca de los datos, estas
tablas se construyen por medio de la tabulación de los
datos, este procedimiento
es relativamente sencillo, para realizarlo nos ocupamos de un
conjunto de datos estadísticos obtenidos al registrar
los resultados de una serie de n repeticiones de algún
experimento u observación aleatoria, suponiendo que las
repeticiones son mutuamente independientes y se realizan en
condiciones uniformes, es importante decir que el resultado de
cada observación puede expresarse de forma
numérica, para este tipo de tablas de entrada de datos
se puede trabajar con una ó mas variables, de manera que
nuestro material estadístico consiste en n valores
observados de la variable Xj.
Los valores
observados se suelen registrar, en primer lugar en una lista,
si él numero de observaciones no excede de 20 ó
30, estos datos se registran en orden creciente de
magnitud.
Con los datos de esta tabla pueden hacerse diversas
representaciones gráficas y calcularse determinadas
características numéricas como la
media, la mediana,etc.
EJ: Agrupar en una tabla de datos
10, 1, 6, 9, 2, 5, 7, 4, 3, 8
X | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
- Tablas de frecuencias: Una tabla
de frecuencia esta formada por las categorías o valores
de una variable y sus frecuencias correspondientes. Esta tabla
es lo mismo que una distribución de frecuencias. Esta tabla
se crea por medio de la tabulación y agrupación,
la cual es un método
sencillo como lo habíamos empezado a ver en la tabla de
datos, Se realiza el mismo procedimiento
de tabulación anteriormente descrito si el numero de
valores observados para la variable, se trabaja con una sola
variable, descontando los repetidos son pequeños, si
existen repetidos la frecuencia f es el numero de repeticiones
de un valor de X
dado, Sin embargo, cuando el conjunto de datos es mayor,
resulta laborioso trabajar directamente con los valores
individuales observados y entonces se lleva a cabo, por lo
general, algún tipo de agrupación como paso
preliminar, antes de iniciar cualquier otro tratamiento de los
datos. Las reglas para proceder a la agrupación son
diferentes según sea la variable, discreta o continua,
para una variable discreta suele resultar conveniente hacer una
tabla en cuya primera columna figuren todos los valores
de la variable X representados en el material, y en la segunda,
la frecuencia f con que ha aparecido cada valor de X
en las observaciones.
Para una variable continua, el procedimiento de
agrupación es algo más complicado. Se toma un
intervalo adecuado sobre el eje de la variable que contenga los
n valores observados, y divídase el intervalo en cierto
numero de intervalos de clase. Todas las observaciones que
pertenecen al mismo intervalo de clase se agrupan y cuentan, y
él numero que resulte representa la frecuencia de clase
correspondiente a dicho intervalo, luego se forma una tabla, en
cuya primera columna figuran los limites de cada intervalo de
clase, y en la segunda aparecen las correspondientes
frecuencias.
Estas clases de tablas son las mas usadas y brindan
mayor información de los datos que las tablas
de entradas de datos, efectivamente, una tabla de este tipo
dará en forma abreviada, una información completa
acerca de la distribución de los valores observados.
Con estas se pueden utilizar mas a fondo los métodos
gráficos al igual que los métodos
aritméticos.
Ej: Agrupar en una tabla 1, 1, 2, 2, 2, 2, 3, 3, 3, 4,
5
X | F |
1 | 2 |
2 | 4 |
3 | 3 |
4 | 1 |
5 | 1 |
S |
Agrupar en una tabla las siguientes estaturas: 160,
168, 175, 183, 170, 164, 170, 184, 171, 168, 187, 161, 183,
175, 185, 186, 187, 164, 165, 175, 162, 188, 169, 163, 166,
172, 173, 167, 174, 176, 178, 179, 177
X | F |
160-165 | 6 |
265-270 | 6 |
170-175 | 6 |
175-180 | 7 |
180-185 | 3 |
185-190 | 5 |
S |
- Tablas de doble entrada:
También llamadas tablas de contingencias, son
aquellas tablas de datos referentes a dos variables, formada,
en las cabeceras de las filas, por las categorías o
valores de una variable y en las de las columnas por los de la
otra, y en las casillas de la tabla, por las frecuencias o
numero de elementos que reúnen a la vez las dos
categorías o valores de las dos variables que se cruzan
en cada casilla. Para la tabulación de un material
agrupado de observaciones simultaneas de dos variables
aleatorias necesitaremos una tabla descrita como anteriormente
lo describimos, las reglas para agrupar son las mismas que en
el caso de una sola variable.
Este tipo de tablas brindan información
estadística de dos eventos
relacionados entre sí, es útil en casos en los
cuales los experimentos
son dependientes de otro experimento, mas adelante aparecen mas
aplicaciones del análisis estadístico
bivariable.
Ej:
T1/T2 | SÍ | NO |
SÍ | 12 | 2 |
NO | 10 | 4 |
Primero definiré lo que es un gráfico o
diagrama en
estadística
Un diagrama es
una especie de esquemático, formado por líneas,
figuras, mapas, utilizado
para representar, bien datos estadísticos a escala o
según una cierta proporción, o bien los elementos
de un sistema, las
etapas de un proceso y las
divisiones o subdivisiones de una clasificación. Entre las
funciones que
cumplen los diagramas se
pueden señalar las siguientes:
- Hacen más visibles los datos, sistemas y
procesos - Ponen de manifiesto sus variaciones y su evolución histórica o
espacial. - Pueden evidenciar las relaciones entre los diversos
elementos de un sistema o de un
proceso y
representar la correlación entre dos o más
variables. - Sistematizan y sintetizan los datos, sistemas y
procesos. - Aclaran y complementan las tablas y las exposiciones
teóricas o cuantitativas. - El estudio de su disposición y de las
relaciones que muestran pueden sugerir hipótesis nuevas.
Algunos de los diagramas
más importantes son el diagrama en árbol, diagrama
de áreas o superficies, diagrama de bandas, diagrama de
barras, diagrama de bloques, diagrama circular, diagrama circular
polar, diagrama de puntos, diagrama de tallo y hoja diagrama,
histogramas y gráficos de caja y bigote o
boxplots.
2.1 Gráficos univariados: Para trabajar
los gráficos univariables debemos primero saber lo que es
el análisis estadístico univariable y
después de esto trabajaremos los métodos
pedidos
El análisis estadístico que opera
con datos referentes a una sola variable o distribución de
frecuencias y pretende determinar sus propiedades estadísticas. El a.e.u. proporciona al
analista medidas representativas de la distribución o
promedios, índices de dispersión de los datos de la
distribución, procedimientos
para normalizar los datos, medidas de desigualdad de unos datos
en relación con otros y por ultimo medidas de la
asimetría de la distribución.
- Gráficos de puntos: Es una
variación del diagrama lineal simple el cual esta
formado por líneas rectas o curvas, que resultan de la
representación, en un eje de coordenadas, de
distribuciones de frecuencias, este construye colocando en el
eje x los valores correspondientes a la variable y en el eje de
las ordenadas el valor correspondiente a la frecuencia para
este valor. Proporciona principalmente información con
respecto a las frecuencias. Este se usa cuando solo se necesita
información sobre la frecuencia.
Cuando la muestra se
agrupa por intervalos se trabaja con la marca de clase
del intervalo de clase, la marca de clase
es el punto medio del intervalo
EJ: Duración de tubos de neón
X(horas) | Xm | F |
300-400 | 350 | 2 |
400-500 | 450 | 6 |
500-600 | 550 | 10 |
600-700 | 650 | 8 |
700-800 | 750 | 4 |
S |
- Gráficos de tallo y hoja:
es una forma rápida de obtener una
representación visual ilustrativa del conjunto de datos,
para construir un diagrama de tallo y hoja primero se debe
seleccionar uno ó más dígitos iniciales
para los valores de tallo, el dígito o dígitos
finales se convierten en hojas, luego se hace una lista de
valores de tallo en una columna vertical. Prosiguiendo a
registrar la hoja por cada observación junto al valor
correspondiente de tallo, finalmente se indica las unidades de
tallos y hojas en algún lugar del diagrama, este se usa
para listas grandes y es un método
resumido de mostrar los datos, posee la desventaja que no
proporciona sino los datos, y no aparece por ningún lado
información sobre frecuencias y demás datos
importantes.
Ej: realice un diagrama de tallo y hoja para los
siguientes datos de distancias en yardas de una cancha de
golf
6435 6464 6433 6470 6526 6527 6506 6583 6605 6694 6614
6790 6770 6700 6798 6770 6745 6713 6890 6870 6873 6850 6900
6927 6936 6904 7051 7005 7011 7040 7050 7022 7131 7169 7168
7105 7113 7165 7280 7209
- Diagramas de barras: nombre que recibe el
diagrama utilizado para representar gráficamente
distribuciones discretas de frecuencias no agrupadas. Se llama
así porque las frecuencias de cada categoría de
la distribución se hacen figurar por trazos o columnas
de longitud proporcional, separados unos de otros. Existen tres
principales clases de gráficos de barras: - Barra simple: se emplean para graficar hechos
únicos - Barras múltiples: es muy recomendable para
comprar una serie estadística con otra, para ello emplea
barras simples se distinto color o tramado
en un mismo plano cartesiano, una al lado de la
otra - Barras compuestas: en este método de
graficacion las barras de la segunda serie se colocan encima de
las barras de la primera serie en forma respectiva.
El diagrama de barras proporciona información
comparativa principalmente y este es su uso principal, este
diagrama también muestra la
información referente a las frecuencias
Ej:
CIUDAD | TEMPERATURA |
A | 12 |
B | 18 |
C | 24 |
TIENDA | Enero | Febrero | Marzo | abril | mayo | Junio |
A | 800 | 600 | 700 | 900 | 1100 | 1000 |
B | 700 | 500 | 600 | 1000 | 900 | 1200 |
Histogramas: Se emplea para ilustrar
muestras agrupadas en intervalos. Esta formado por
rectángulos unidos a otros, cuyos vértices de la
base coinciden con los limites de los intervalos y el centro de
cada intervalo es la marca de clase, que representamos en el eje
de las abscisas. La altura de cada rectángulo es
proporcional a la frecuencia del intervalo respectivo. Esta
proporcionalidad se aplica por medio de la siguiente
formula
Altura del rectángulo = frecuencia
relativa/longitud de base
El histograma se usa para representar variables
cuantitativas continuas que han sido agrupadas en intervalos de
clase, la desventaja que presenta que no funciona
para variables discretas, de lo contrario es una forma
útil y practica de mostrar los datos
estadísticos.
EJ:
X | Xm | F |
118-126 | 122 | 2 |
126-134 | 130 | 3 |
134-142 | 138 | 8 |
142-150 | 146 | 12 |
150-158 | 154 | 7 |
158-166 | 162 | 5 |
166-174 | 170 | 2 |
174-182 | 178 | 1 |
S |
- Diagramas de caja o boxplots: los
pasos para construirlo son los siguientes: - dibujar y marcar un eje de medida
horizontal - construir un rectángulo cuyo borde izquierdo
esta arriba del cuarto inferior y cuyo borde derecho esta
arriba del cuarto superior - dibujar un segmento de recta vertical dentro de la
caja arriba de la mediana - prolongar rectas desde cada extremo de la caja hasta
las observaciones más lejanas que estén
todavía a menos de 1.5fs de los bordes
correspondientes - dibujar un circulo abierto para identificar cada
observación que caiga entre 1.5fs y 3fs del borde al
cual esta más cercano estas se llaman puntos inusuales
suaves - dibujar un circulo de línea llena para
identificar cada observación que caiga a mas de 3fs del
borde más cercano, estas se llaman puntos inusuales
extremos
donde fs= cuarto superior – cuarto
inferior
este diagrama se usa cuando se necesita la mayor
información acerca de la distribución de los
datos, la ventaja que posee con respecto a los demás
diagramas es que este gráfico posee
características como centro y dispersión de los
datos, y la principal desventaja que posee es que no presenta
ninguna información acerca de las frecuencias que
presentan los datos
EJ: Para los siguientes datos realice un diagrama de
caja: 2.68 3.06 4.31 4.71 5.71 5.99 6.06 7.04 7.17 7.46 7.50
8.27 8.42 8.73 8.84 9.14 9.19 9.21 9.39 11.28 15.19
21.06
- Gráficos de sectores: es un
gráfico que se basa en una proporcionalidad entre la
frecuencia y el ángulo central de una circunferencia, de
tal manera que a la frecuencia total le corresponde el
ángulo central de 360°. Para construir se aplica la
siguiente formula:
X = frecuencia relativa *
360°/S
frecuencia relativa
Este se usa cuando se trabaja con datos que tienen
grandes frecuencias, y los valores de la variable son pocos, la
ventaja que tiene este diagrama es que es fácil de hacer
y es entendible fácilmente, la desventaja que posee es
que cuando los valores de la variable son muchos es casi
imposible o mejor dicho no informa mucho este diagrama y no es
productivo, proporciona principalmente información
acerca de las frecuencias de los datos de una manera entendible
y sencilla.
EJ: Representar mediante un gráfico de sectores
la frecuencia con que aparece cada una de las cinco vocales en
el presente párrafo:
Vocal | a | e | i | o | u | |
Frecuencia | 13 | 20 | 4 | 6 | 3 | S |
2.2 gráficos bivariados: Para
trabajar los diagramas de dispersión, primero debemos
saber que es el análisis estadístico bivariable y
las ventajas que este tiene
El análisis estadístico bivariable es
aquel análisis que opera con datos referentes a dos
variables y pretende descubrir y estudiar sus propiedades
estadísticas. El análisis
estadístico bivariable se orienta fundamentalmente a la
normalización de los valores o frecuencias
ce los datos brutos, determina la existencia, dirección y grado de la variación
conjunta entre las dos variables, lo que se realiza mediante
él calculo de los coeficientes de correlación
pertinentes, calcula la covarianza o producto de
las desviaciones de las dos variables en relación a sus
medias respectivas y por ultimo establece la naturaleza y
forma de la asociación entre las dos variables en el caso
de las variables de intervalo.
- Diagrama de dispersión: es un diagrama
que representa gráficamente, en un espacio de ordenadas,
los puntos de dicho espacio que corresponden a los valores
correlativos de una distribución bivariante conjunta,
estos diagramas deben usarse cuando tenemos un análisis
estadístico bivariable, ósea una tabla de datos
de doble entrada, la ventaja que tienen es que se puede
graficar de una forma sencilla una distribución
bivariante conjunta y la desventaja principal es que no
funciona si sucede que una dupla se repita
EJ:
X | Y | |
A | 2 | 3 |
B | 4 | 1 |
C | 5 | 4 |
D | 3 | 6 |
E | 2 | 8 |
- Sierra Bravo. R. Diccionario
Practico de Estadística, Ed Paraninfo S.A. Madrid.
España, pags 56-57, 177-187,
427-432. - Serrano Rodríguez, Javier. Introducción a la Estadística. Ed
universitaria de América LIDA, Bogotá, Colombia. Pag
30-49 - Devore, Jay L. Probabilidad y
Estadística para ingeniería y ciencias, Ed
Thomson, 4ta Edición, pags 7-37.
NINI ALEJANDRA GOMEZ LASSO