Métodos Cuantitativos
Las pruebas no-paramétricas se necesitan cuando no se tienen información sobre la composición de los datos poblacionales, esto es no se tiene conocimiento sobre su distribución de probabilidad. Se utilizan cuando no se cumplen las condiciones exigidas para la aplicación de las paramétricas. También cuando las muestras son pequeñas y falta información respecto de la densidad de probabilidad.
Dentro de las pruebas no-paramétricas, una muy utilizada es la Prueba de Suma de Rangos de Wilcoxon o también llamada prueba "U" de Mann-Whitney, la cual es una alternativa a la paramétrica "t" bimuestral.
En estadística la prueba U de Mann-Whitney (también llamada de Mann-Whitney-Wilcoxon, prueba de suma de rangos Wilcoxon, o prueba de Wilcoxon-Mann-Whitney) es una prueba no paramétrica aplicada a dos muestras independientes. Es, de hecho, la versión no paramétrica de la habitual prueba "t" de Student.
Fue propuesto inicialmente en 1945 por Frank Wilcoxon para muestras de igual tamaños y extendido a muestras de tamaño arbitrario como en otros sentidos por Henry B. Mann y D. R. Whitney en 1947.
Planteamiento de la prueba
La prueba de Mann-Whitney se usa para comprobar la heterogeneidad de dos muestras ordinales. El planteamiento de partida es:
Las observaciones de ambos grupos son independientes
Las observaciones son variables ordinales o continuas.
Bajo la hipótesis nula, la distribución de partida de ambos grupos es la misma y,
Bajo la hipótesis alternativa, los valores de una de las muestras tienden a exceder a los de la otra: P(X > Y) + 0.05 P(X = Y) > 0.05.
Cálculo estadístico.
Para calcular el estadístico U se asigna a cada uno de los valores de las dos muestras su rango para construir
Donde n1 y n2 son los tamaños respectivos de cada muestra; R1 y R2 es la suma de los rangos de las observaciones de las muestras 1 y 2 respectivamente.
El estadístico U se define como el mínimo de U1 y U2.
Los cálculos tienen que tener en cuenta la presencia de observaciones idénticas a la hora de ordenarlas. No obstante, si su número es pequeño, se puede ignorar esa circunstancia.
Distribución del estadístico.
La prueba calcula el llamado estadístico U, cuya distribución para muestras con más de 20 observaciones se aproxima bastante bien a la distribución normal.
La aproximación a la normal, z, cuando tenemos muestras lo suficientemente grandes viene dada por la expresión:
Donde mU y sU son la media y la desviación estándar de U si la hipótesis nula es cierta, y vienen dadas por las siguientes fórmulas:
Esta prueba estadística es útil cuando las mediciones se pueden ordenar en escala ordinal (es decir, cuando los valores tienden a una variable continua, pero no tienen una distribución normal) y resulta aplicable cuando las muestras son independientes.
Este procedimiento es una buena alternativa cuando no se puede utilizar la prueba t de Student, en razón de no cumplir con los requisitos que esta prueba exige.
La fórmula es la siguiente:
Donde:U1 y U2 = valores estadísticos de U Mann-Whitney.n1 = tamaño de la muestra del grupo 1.n2 = tamaño de la muestra del grupo 2. R1 = sumatoria de los rangos del grupo 1.R2 = sumatoria de los rangos del grupo 2. |
Pasos:
Determinar el tamaño de las muestras (n1 y n2). Si n1 y n2 son menores que 20, se consideran muestras pequeñas, pero si son mayores que 20, se consideran muestras grandes.
Arreglar los datos en rangos del menor al mayor valor. En caso de que existan ligas o empates de rangos iguales, se deberán detectar para un ajuste posterior.
Calcular los valores de U1 y U2, de modo que se elija el más pequeño para comparar con los críticos de U Mann-Whitney de la tabla de probabilidades asociadas con valores pequeños como los de U en la prueba de Mann-Whitney.
En caso de muestras grandes, calcular el valor Z, pues en estas condiciones se distribuye normalmente.
Decidir si se acepta o rechaza la hipótesis.
Ejemplo para muestras pequeñas:
Un experimentador utiliza dos métodos para enseñar a leer a un grupo de 10 niños de 6 años, quienes ingresan por primera vez a la escuela. El experimentador quiere demostrar que el procedimiento ideado por él es más efectivo que el tradicional; para ello, mide el desempeño en la lectura en función de la fluidez, comprensión, análisis y síntesis.
El plan experimental preliminar consiste en elegir al azar tanto una muestra de 10 niños como el método por utilizar.
Elección de la prueba estadística. El modelo experimental tiene dos muestras independientes. Las mediciones revelan que no se satisfacen los requisitos para utilizar una media aritmética, en razón de que uno de los valores en cada muestra se aleja demasiado de las demás; por lo tanto, no corresponde a una escala de intervalo, de manera que se decide usar una escala ordinal.
Planteamiento de la hipótesis
Hipótesis alterna (Ha). Las calificaciones de ejecución de lectura, según el método de enseñanza del experimentador son más altas y diferentes que las observadas en el método tradicional.
Hipótesis nula (Ho). Las diferencias observadas entre las calificaciones de ejecución de lectura mediante los dos métodos se deben al azar.
Nivel de significación. Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Dos métodos diferentes aplicados en dos grupos de niños.
Aplicación de la prueba estadística.De acuerdo con los paso, las observaciones se deben ordenar en rangos del menor al mayor.Rangos de lectura de la tabla anterior.
Calculamos la U.
De los dos valores de U calculados, se elge el más pequeño (4) y se comparan con los valores críticos de U Mann-Whitney.
En caso de que el valor de U calculado no se localice en las tablas correspondientes, se transformará en la fórmula siguiente:
U = n1n2 - U'
En esta fórmula, U' corresponde al valor más alto.
Decisión.A la probabilidad del valor U de Mann-Whitney, calculado anteriormente, corresponde 0.048, el cual es más pequeño que el nivel de significancia; por lo tanto, se acepta Ha y se rechaza Ho.
Interpretación.Entre las calificaciones de la ejecución de lectura mediante los dos métodos de enseñanza existe una diferencia significativa a un nivel de probabilidad de error menor que 0.05; es decir, aun cuando las muestras son pequeñas, las calificaciones más altas mediante el método diseñado por el experimentador señalan más efectividad, con la probabilidad de equivocarse de 0.048 para aceptarlo.
Ejemplo aplicable cuando la muestra es mayor a 25 y donde n1 y n2 pueden ser iguales o de un tamaño diferente:
El experimentador del ejemplo previo, entusiasmado por las observaciones preliminares, decide aumentar el tamaño de las muestras. En este estudio tiene 10 niños con el métodod tradicional y 25 mediante el procedimiento ideado por él. Los datos del nuevo estudio se muestran en la tabla más adelante.
Elección de la prueba estadística. El diseño experimental tiene dos muestras independientes. Las mediciones en esta condición quizá no impidan utilizar una prueba paramétrica, sin mebargo, para fines de aprendizaje, se decide utilizar una escala ordinal y continuar con la prueba de U de Mann-Whitney.
Planteamiento de la hipótesis.
Hipótesis alterna (Ha). Las calificaciones aportadas por el método reciente, ideado por el experimentador, son diferentes y con valores más altos.
Hipótesis nula (Ho). Las diferencias entre las calificaciones dadas por ambos métodos se deben al azar.
Nivel de significación.Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Población de niños de 6 años a los cuales se les aplicó dos métodos de enseñanza.
Aplicación de la prueba estadística.Primero ordenamos los rangos de todas las observaciones.
Dirección de las ligas o empates y el tamaño de estas.
Calculamos la U.
Tomando en cuanta los pasos, nos menciona que cuando la muestra es mayor que 25, se distribuye normalmente, por lo cual se determina el valor Z para conocer la probabilidad. Esto se calcula como sigue:
Dónde:Z = valor estadístico de la curva normal.U = cualquier valor de U calculado (ya sea U1 o U2).= valor promedio de U.sU = desviación estándar de U. |
Calculamos el valor promedio de U ():
La desviación estándar de U de determina de la forma siguiente:
Donde:sU = desviación estándar de U.n1 y n2 = tamaño de la muestra de los grupos 1 y 2.N = tamaño total de la muestra (la suma de n1 y n2).Li = sumatoria de las ligas o empates. |
El cálculo de Li se realiza de la siguiente manera:
Una vez obtenida la sumatoria de Li, se determina la desviación estándar de U (?U) mediante la expresión siguiente:
Una vez calculados los parámetros necesarios, se obtiene el valor Z conforme la siguiente fórmula:
Para obtener la probabilidad del valor Z de 1.95, se debe consultar la tabla de tamaño de la muestra en función de los valores d y buscar la hilera 1.9, en cuya columna 0.05 se localiza el número 0.0256, que corresponde a la probabilidad del valor de U con respecto al promedio. Esto quiere decir que es menor que el nivel de significancia.
Decisión.A la cifra de Z de 1.95 le corresponde una probabilidad menor que 0.05, por lo cual se acepta Ha y se rechaza Ho (tabla de probabilidades asociadas en valores extremos como los de 2 en la distribución normal).
Interpretación.El experimentador, al aumentar su muestra, confirma la investigación preliminar con una muestra pequeña, con lo cual da a entender que los resultados logrados con el método ideado por él son diferentes de los obtenidos con el método de enseñanza de lectura tradicional; además, este último revela calificaciones más bajas y es menos efectivo que el otro.
La efectividad del método ideado por el experimentador se traduce en mayor fluidez de la lectura, mejor comprensión y análisis y síntesis superior, en razón de que las calificaciones finales son consecuencia de estas condiciones.
Referencias Bibliográficas
Downie, N. (1973) Métodos estadísticos aplicados. Harper & Row Publisher Inc. Standard Book Number 06-3100746
Farfán, J. (2013) Apuntes de estadística en investigación educativa. Universidad Nacional Enrique Guzmán y Valle. Lima. Perú
Farfán, J. (2014) Introducción a la investigación educativa. Universidad Nacional Federico Villarreal. Lima. Perú.
Autor:
Dr. Johnny Félix Farfán Pimentel