Distribuciones empíricas de frecuencias bivariadas, bidimensionales o conjuntas
METODOLOGÍA PARA EL ESTUDIO Y
USO
RESUMEN
El presente trabajo tiene
características peculiares, pues en él se abordan
contenidos fundamentales de la Estadística Descriptiva, como son: Las
distribuciones empíricas de frecuencias bivariadas,
teniendo en cuenta que los datos son
cuantitativos, la notación para las variables y
las observaciones para las mismas, su clasificación de
acuerdo a los tipos de variables que para datos cuantitativos
pueden presentarse, en primer lugar las dos variables son
discretas o discontiuas, en segundo lugar, las dos variables son
continuas, y por último, un sistema mixto
formado por una variable aleatoria discreta y la otra
continua.
Los contenidos abordados, incluyen, ademas, las DEF
relativas y absolutas marginales y su interpretación, la DEF absolutas acumuladas
bivariadas, la DEF relativas acumulada bivarada. Tambien
está desarrollado el estudio y la forma de resolver
problemas de
aplicación que conducen a la formación de DEF
bivariadas, incluyendo el cálculo de
las medidas de posición o tendencia central y de
dispersión, la independencia
estadística entre dos variables, la covarianza de dos
variables y el coeficiente de correlacion lineal y sus
propiedades.
Sin embargo, consideramos que por su importancia, lo
más novedoso es el tratamiento y el procesamientom
computacional que le hemos dado a todos estos contenidos de la
Estadística
Descriptiva, y en el cual usamos el paquete de programas
estadístico profesional Statgraphics sobre Windows, y es
así, debido a que en la bibliografía consultada no
se utiliza ni se habla de tratar estos aspectos
computacionalmente.
INTRODUCCIÓN
Para iniciar el tratamiento de estos aspectos, se hace
necesario algunas consideraciones de los mismos.
Obtención de las
distribuciones empíricas de frecuencias (absolutas y
relativas) bivariadas o conjuntas y de las distribuciones
empíricas de frecuencias (absolutas y relativas)
marginales, usando el Statgwin.
Usando el Statgwin, y teniendo a disposición los
datos originales obtenidos de forma simultánea sobre ambas
variables discretas, podemos obtener fácilmente las
distribuciones empíricas de frecuencias (absolutas y
relativas) bivariadas o conjuntas y las distribuciones
empíricas de frecuencias (absolutas y relativas)
marginales de cada una de las variables. Para ello, lo primero
que hay que hacer es confeccionar un fichero con las dos
variables discretas que estamos analizando. A cada una de las
variables de este fichero, le damos como valores,
los valores de
las observaciones o datos obtenidos simultáneamente sobre
cada variable. Después se procesan los datos de este
fichero usando el siguiente procedimiento: Se
ejecuta el comando Descripción (en inglés,
Describe), se toma la opción Datos Categóricos (en
inglés, Categorical Data) y después se toma la
opción Tabulación cruzada (en inglés,
Crosstabulation). A continuación sale una caja de diálogo en
la que tenemos que dar las variables con las cuales vamos a
construir su distribución empírica de
frecuencias. En Variable Fila (en inglés, Row Variable)
damos el nombre de la variable cuyos valores distintos queremos
que aparezcan en las filas de la tabla de frecuencias, y en
Variable Columna (en inglés, Column Variable), damos el
nombre de la variable cuyos valores distintos queremos que
aparezcan en las columnas de la tabla de frecuencias.
Al procesar (clic en el botón Aceptar), salen en
la pantalla dos ventanas y dos gráficos. En la segunda ventana aparece una
tabla cruzada o tabla de doble entrada (en inglés,
Crosstabulation), en la cual se muestran los siguientes
elementos. En la primera columna de la tabla aparecen los valores
distintos o diferentes de la variable X1, o sea, los
valores de Y1, y en la primera fila de la tabla
aparecen los valores distintos o diferentes de la variable
X2, o sea, los valores de Y2. En cada celda
de la tabla se muestran dos números. El primer
número que aparece es el valor de la
frecuencia absoluta bivariada o conjunta del par de valores de
las variables Y1 y Y2 correspondiente a
dicha celda, es decir, el número de veces que ocurren o
aparecen juntos o simultáneamente el valor de
Y1 y el valor de Y2 correspondiente a dicha
celda.
Esta tabla que contiene los valores distintos o
diferentes de las variables X1 y X2 y sus
frecuencias absolutas bivariadas o conjuntas define lo que se
conoce con el nombre de distribución empírica de
frecuencias absolutas bivariadas de las variables X1 y
X2.
El segundo número que aparece en cada celda
(expresado en porcentaje o por ciento) es el porcentaje o por
ciento (%) que representa la frecuencia absoluta bivariada o
conjunta de esa celda con respecto al número total de
observaciones (n), o sea, que el porcentaje en cada celda es
igual a la frecuencia relativa expresada en porcentaje o por
ciento (%). Estas frecuencias relativas bivariadas definen, junto
con los pares de valores distintos de las variables X1
y X2, la distribución empírica de
frecuencias relativas bivariadas de las variables X1 y
X2.
En los márgenes derecho e inferior de esta tabla
aparecen las distribuciones empíricas de frecuencias
(absolutas y relativas) marginales de las variables X1
y X2 respectivamente.
A modo de resumen podemos decir que en la tabla que nos
da el Statgwin, las frecuencias relativas bivariadas o conjuntas
en cada celda y las frecuencias relativas marginales, siempre se
muestran expresadas en por ciento o porcentajes (%). La
frecuencia relativa de cada celda, expresada en porcentaje o por
ciento (%), no es más que el por ciento que representa la
frecuencia absoluta de dicha celda con respecto al número
total de observaciones (n). El valor de n es igual a la suma de
todas las frecuencias absolutas bivariadas o conjuntas, y es,
además, igual a la suma de todas las frecuencias absolutas
marginales de cada distribución marginal.
Página siguiente |