Empecemos con unas definiciones:
Estadística: es la técnica de
estudiar la información que nos da una muestra de una
determinada población para poder conocer la
última.Población: Es un conjunto de
elementos con una cualidad común, la cual es objeto de
estudio.Estadística Descriptiva: es la
técnica que nos ayuda a describir las variables de una
muestra o población.Muestreo: es la técnica que nos
ayuda a determinar el número y el tipo de individuos a
escoger de la población, para estudiar y poder
extrapolar los resultados a ésta última.Universo: es el conjunto de todos los
elementos.
Si u es un universo un universo y queremos estudiar de el la
variable aleatoria X, la población respecto de la
misma será
Análisis
descriptivo
Cuando se dispone de datos de una población, y
antes de abordar análisis
estadísticos más complejos, un primer paso consiste en
presentar esa información de forma que
ésta se pueda visualizar de una manera más
sistemática y resumida. Los datos que nos interesan
dependen, en cada caso, del tipo de variables que estemos
manejando2.
Para variables
categóricas3, como el sexo, estadio TNM,
profesión, etc., se quiere conocer la frecuencia y el
porcentaje del total de casos que "caen" en cada categoría.
Una forma muy sencilla de representar gráficamente estos
resultados es mediante diagramas de barras o diagramas
de sectores. En los gráficos de sectores,
también conocidos como diagramas de "tartas", se divide un
círculo en tantas porciones como clases tenga la variable,
de modo que a cada clase le corresponde un arco
de círculo proporcional a su frecuencia absoluta o relativa.
Un ejemplo se muestra en la
Figura 1. Como se puede observar, la información que se
debe mostrar en cada sector hace referencia al número de
casos dentro de cada categoría y al porcentaje del total que
estos representan. Si el número de categorías es
excesivamente grande, la imagen proporcionada por el
gráfico de sectores no es lo suficientemente clara y por lo
tanto la situación ideal es cuando hay alrededor de tres
categorías. En este caso se pueden apreciar con claridad
dichos subgrupos.
Los diagramas de barras son
similares a los gráficos de sectores. Se
representan tantas barras como categorías tiene la variable,
de modo que la altura de cada una de ellas sea proporcional a la
frecuencia o porcentaje de casos en cada clase (Figura
2). Estos mismos gráficos pueden utilizarse también
para describir variables numéricas discretas
que toman pocos valores (número de hijos,
número de recidivas, etc.).
Para variables numéricas
continuas, tales como la edad, la tensión arterial
o el índice de masa corporal, el tipo de gráfico
más utilizado es el histograma. Para construir un
gráfico de este tipo, se divide el rango de valores de la
variable en intervalos de igual amplitud, representando sobre
cada intervalo un rectángulo que tiene a este segmento como
base. El criterio para calcular la altura de cada rectángulo
es el de mantener la proporcionalidad entre las frecuencias
absolutas (o relativas) de los datos en cada intervalo y el
área de los rectángulos. Como ejemplo, la
Tabla I muestra la distribución de frecuencias
de la edad de 100 pacientes, comprendida entre los 18 y 42
años. Si se divide este rango en intervalos de dos
años, el primer tramo está comprendido entre los 18 y
19 años, entre los que se encuentra el 4/100=4% del total.
Por lo tanto, la primera barra tendrá altura proporcional a
4. Procediendo así sucesivamente, se construye el histograma
que se muestra en la
Figura 3. Uniendo los puntos medios del extremo superior de
las barras del histograma, se obtiene una imagen que se llama
polígono de frecuencias. Dicha figura pretende
mostrar, de la forma más simple, en qué rangos se
encuentra la mayor parte de los datos. Un ejemplo, utilizando los
datos anteriores, se presenta en la
Figura 4.
Página siguiente |