Pruebas de hipótesis para proporciones
- Prueba de
proporciones de una muestra - Prueba de
proporciones de dos muestras - Prueba de
proporciones de k muestras - Bibliografía
Las pruebas de proporciones son adecuadas cuando los
datos que se están analizando constan de cuentas o
frecuencias de elementos de dos o más clases. El objetivo
de estas pruebas es evaluar las afirmaciones con respecto a una
proporción (o Porcentaje) de población. Las pruebas
se basan en la premisa de que una proporción muestral (es
decir, x ocurrencias en n observaciones, o x/n) será igual
a la proporción verdadera de la población si se
toman márgenes o tolerancias para la variabilidad
muestral. Las pruebas suelen enfocarse en la diferencia entre un
número esperado de ocurrencias, suponiendo que una
afirmación es verdadera, y el número observado
realmente. La diferencia se compara con la variabilidad prescrita
mediante una distribución de muestreo que tiene como base
el supuesto de que es
realmente verdadera.
En muchos aspectos, las pruebas de proporciones se
parecen a las pruebas de medias, excepto que, en el caso de las
primeras, los datos muestrales se consideran como cuentas en
lugar de como mediciones. Por ejemplo, las pruebas para medias y
proporciones se pueden utilizar para evaluar afirmaciones con
respecto a:
1) Un parámetro de población único
(prueba de una muestra)
2) La igualdad de parámetros de dos poblaciones
(prueba de dos muestras), y
3) La igualdad de parámetros de más de dos
poblaciones (prueba de k muestras). Además, para
tamaños grandes de muestras, la distribución de
muestreo adecuada para pruebas de proporciones de una y dos
muestras es aproximadamente normal, justo como sucede en el caso
de pruebas de medias de una y dos muestras.
Prueba de proporciones
de una muestra
Cuando el objetivo del muestreo es evaluar la validez de
una afirmación con respecto a la proporción de una
población, es adecuado utilizar una prueba de una muestra.
La metodología de prueba depende de si el número de
observaciones de la muestra es grande o
pequeño.
Como se habrá observado anteriormente, las
pruebas de grandes muestras de medias y proporciones son bastante
semejantes. De este modo, los valores estadísticos de
prueba miden la desviación de un valor estadístico
de muestra a partir de un valor propuesto. Y ambas pruebas se
basan en la distribución normal estándar para
valores críticos. Quizá la única diferencia
real entre las ambas radica en la forma corno se obtiene la
desviación estándar de la distribución de
muestreo.
Esta prueba comprende el cálculo del valor
estadístico de prueba Z
Posteriormente este valor es comparado con el valor de
Z, obtenido a partir de una tabla normal a un nivel de
significación seleccionado.
Como ocurrió con la prueba de medias de una
muestra, las pruebas de proporciones pueden ser de una o dos
colas.
La primera alternativa establece una prueba de cola
derecha, la segunda, izquierda y la tercera, una prueba de dos
colas.
Ejemplo ilustrativo
En un estudio se afirma que 3 de 10 estudiantes
universitarios trabajan. Pruebe esta aseveración, a un
nivel de significación de 0,025, respecto a la alternativa
de que la proporción real de los estudiantes
universitarios trabajan es mayor de lo que se afirma, si una
muestra aleatoria de 600 estudiantes universitarios revela que
200 de ellos trabajan. La muestra fue tomada de 10000
estudiantes.
Los datos son:
Como en los datos aparece el tamaño de la
población, se debe verificar si el tamaño de la
nuestra es mayor que el 5%. Se remplaza valores en la siguiente
fórmula:
Los cálculos en Excel se muestran en la siguiente
figura:
El gráfico elaborado en Winstats y Paint se
muestra a continuación:
Decisión:
Prueba de proporciones
de dos muestras
El objetivo de una prueba de dos muestras es determinar
si las dos muestras independientes fueron tomadas de dos
poblaciones, las cuales presentan la misma proporción de
elementos con determinada característica. La prueba se
concentra en la diferencia relativa (diferencia dividida entre la
desviación estándar de la distribución de
muestreo) entre las dos proporciones muestrales. Diferencias
pequeñas denotan únicamente la variación
casual producto del muestreo (se acepta H0), en tanto que grandes
diferencias significan lo contrario (se rechaza H0). El valor
estadístico de prueba (diferencia relativa) es comparado
con un valor tabular de la distribución normal, a fin de
decidir si H0 es aceptada o rechazada. Una vez más, esta
prueba se asemeja considerablemente a la prueba de medias de dos
muestras.
La hipótesis nula en una prueba de dos muestras
es
Ejemplo ilustrativo
Se ponen a prueba la enseñanza de la
Estadística empleando Excel y Winstats. Para determinar si
los estudiantes difieren en términos de estar a favor de
la nueva enseñanza se toma una muestra de 20 estudiantes
de dos paralelos. De paralelo A 18 están a favor, en tanto
que del paralelo B están a favor 14. ¿Es posible
concluir con un nivel de significación de 0,05 que los
estudiantes que están a favor de la nueva enseñanza
de la Estadística es la misma en los dos
paralelos?.
Los datos son:
Las hipótesis son
Calculando la proporción muestral se
obtiene:
Los cálculos en Excel se muestran en la siguiente
figura:
El gráfico elaborado en Winstats y Paint se
muestra a continuación:
Decisión:
Prueba de proporciones
de k muestras
La finalidad de una prueba de k muestras es evaluar la
aseveración que establece que todas las k muestras
independientes provienen de poblaciones que presentan la misma
proporción de algún elemento. De acuerdo con esto,
las hipótesis nula y alternativa son
En una muestra se puede dar un conjunto de sucesos, los
cuales ocurren con frecuencias observadas "o"(las que se observa
directamente) y frecuencias esperadas o teóricas "e" (las
que se calculan de acuerdo a las leyes de
probabilidad).
Por lo tanto el valor estadístico de prueba para
este caso es la prueba ji cuadrado o conocida
también como chi cuadrado
Como sucede con las distribuciones t y F, la
distribución ji cuadrado tiene una forma que depende del
número de grados de libertad asociados a un determinado
problema.
Para obtener un valor crítico (valor que deja un
determinado porcentaje de área en la cola) a partir de una
tabla de ji cuadrado, se debe seleccionar un nivel de
significación y determinar los grados de libertad para el
problema que se esté resolviendo.
Ejemplos ilustrativos:
Determine el número de grados de libertad y
obtenga el valores crítico en el niveles 0,05 se
significación.
Solución:
Los grados de libertad se calculan
aplicando la fórmula:
Los cálculos en Excel se muestran en
la siguiente figura:
2) La siguiente tabla muestra las frecuencias observadas
y las frecuencias esperadas al lanzar un dado 60 veces.
Contrastar la hipótesis de que el dado es bueno, con un
nivel de significación de 0,01.
Cara del dado | 1 | 2 | 3 | 4 | 5 | 6 | ||||
Frecuencia observada | 6 | 8 | 9 | 15 | 14 | 8 | ||||
Frecuencia esperada | 10 | 10 | 10 | 10 | 10 | 10 |
Solución:
Los cálculos en Excel se muestran en
la siguiente figura:
El gráfico elaborado en Winstats y Paint se
muestra a continuación:
Decisión:
Bibliografía
SUÁREZ, Mario, (2012),
Interaprendizaje de Probabilidades y Estadística
Inferencial con Excel, Winstats y Graph, Primera Edición.
Imprenta M & V, Ibarra, Ecuador.
Autor:
Mario Orlando Suárez
Ibujes