- Caso estadístico
- Aplicaciones
- Pruebas de X2
- Introducción
- Teoría
- Propiedades de las distribuciones Chi Cuadradas
- Supuestos y restricciones
- Gráficos
- Formula
- Tabla de contingencia Ji Cuadrada
- Referencia bibliográfica
PLANTEAMIENTO DE HIPOTESIS EN MAS DE DOS POBLACIONES (Ji-Cuadrada)
CASO ESTADISTICO
Dónde:
X2 = valor estadístico de ji cuadrada.
fo = frecuencia observada.
fe = frecuencia esperada.
En estadística y estadística aplicada se denomina prueba ?² (pronunciado como «ji cuadrado» y a veces como «chi cuadrado») a cualquier prueba en la que el estadístico utilizado sigue una distribución ?² si la hipótesis nula es cierta. Algunos ejemplos de pruebas ?² son:
La prueba ?² de Pearson, la cual tiene numerosas aplicaciones:
La prueba ?² de frecuencias
La prueba ?² de independencia
La prueba ?² de bondad de ajuste
La prueba ?² de Pearson con corrección por continuidad o corrección de Yates
La prueba de Bartlett de homogeneidad de varianzas
La prueba ?² de Pearson se considera una prueba no paramétrica que mide la discrepancia entre una distribución observada y otra teórica (bondad de ajuste), indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis. También se utiliza para probar la independencia de dos variables entre sí, mediante la presentación de los datos en tablas de contingencia.
La fórmula que da el estadístico es la siguiente:
Cuanto mayor sea el valor de menos verosímil es que la hipótesis sea correcta. De la misma forma, cuanto más se aproxima a cero el valor de chi-cuadrado, más ajustadas están ambas distribuciones.
Los grados de libertad gl vienen dados por :
Donde r es el número de filas y k el de columnas.
Criterio de decisión:
No se rechaza cuando En caso contrario sí se rechaza.
Donde t representa el valor proporcionado por las tablas, según el nivel de significación estadística elegido.
APLICACIONES
La distribución ?² tiene muchas aplicaciones en inferencia estadística, por ejemplo en la denominada prueba ?² utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimación de varianzas. También está involucrada en el problema de estimar la media de una población normalmente distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a través de su papel en la distribución t de Student, y participa en todos los problemas de análisis de varianza, por su papel en la distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias independientes con distribución ?².
PRUEBAS DE X2
BONDAD DE AJUSTE
Se utiliza para la comparación de la distribución de una muestra con alguna distribución teórica que se supone describe a la población de la cual se extrajo.
INDEPENDENCIA
La Ho indica que 2 variables o criterios de clasificación son independientes cuando se aplican a un conjunto de individuos (unidades de observación)
Totales Marginales Aleatorios
HOMOGENEIDAD
Se extraen Muestras Independientes de varias poblaciones y se prueban para ver si son homogéneas con respecto a algún criterio de clasificación.
Un conjunto de Totales Marginales Son Fijos mientras que los otros marginales son Aleatorios.
Bondad de Ajuste (para una multinominal)
Esta es una prueba para comparar las probabilidades de (pi) de una distribución multinominal (lo esperado), con las obtenidas en una muestra (lo observado) para determinar si son iguales o no.
Distribución Multinominal
La Distribución Multinominal es una extensión de la distribución Binominal. En vez de haber solo dos posibles resultados (éxitos y fracasos) tenemos k posibles resultados.
Al igual que en la Binominal:
1. Los experimentos son Independientes
2. Hay un número fijo de experimentos
La probabilidad de que ocurra cada uno de los resultados en un experimento p1,.. p2 pk. es constante.
La prueba de Chi Cuadrada es un método útil para comparar resultados experimentales con aquellos que se esperan teóricamente en virtud de una hipótesis.
La distribución Chi cuadrada nos permite probar, si dos o más proporciones de población pueden ser consideradas iguales.
Si clasificamos a una población en diferentes categorías con respecto a dos atributos (edad, y desempeño en el trabajo), podemos utilizar una prueba Chi cuadrada, para comprobar si los dos atributos son independientes entre sí. la distribución Ji cuadrada, se denota por la letra griega X(Ji), elevada al cuadrado: X2.
A medida que aumentan los grados de libertad la curva se va haciendo más simétrica y su cola derecha se va extendiendo.
Características de la distribución
Todos los valores de x2son positivos.
Es una curva sesgada hacia la derecha.
La media de la distribución son sus grados de libertad
INTRODUCCION
En estadística, la distribución ?² (de Pearson) es una distribución de probabilidad continua con un parámetro k que representa los grados de libertad de la variable aleatoria:
dondeZi son variables de distribución normal, de media cero y varianza uno. El que la variable aleatoria X tenga esta distribución se representa habitualmente así:
TEORIA
Distribución de Ji- cuadrado (?²)
Distribución de datos discretos, que es función de la densidad poblacional y cuyos valores varían desde cero hasta infinito positivo.
A diferencia de la distribución Normal o la de t (Test de Student o de t), la función se aproxima asintóticamente al eje horizontal sólo en la cola derecha de la curva y NO en ambas colas.
Como en la distribución de t, no hay solo una distribución de Chi cuadrado ?²sino que existe una distribución para cada número de grados de libertad (?).Las curvas son en forma de ?(jota invertida) al principio, pero más omenos acercándose a la simetría para los grados de libertad superiores.
Pruebas de Bondad de Ajuste.
Para evaluar el ajuste entre frecuencias observadas y esperadas existenestadísticos que prueban en qué medida difieren las mismas y si esadiferencia es significativa o no.
Hay dos métodos que son los más utilizados:
Método de Ji- cuadrado o Chi- cuadrado (?²)
Método G o prueba del logaritmo de la razón de Verosimilitudes
Método de Ji- cuadrado o Chi- cuadrado (?²)
Donde fo= frecuencia observada
fe= frecuencia esperada X²= ? (fo– fe)² /fe
La razón por la que la que esta prueba se ha denominado Chi cuadrado ypor la que muchos han llamado así también al estadístico obtenido X²,es que la distribución de muestreo de esta sumatoria se aproxima a lade una distribución de X² con ?= 1 grados de libertad.
La prueba es siempre a una cola ya que las desviaciones estánelevadas al cuadrado y conducen siempre a valores positivos
PROPIEDADES DE LAS DISTRIBUCIONES CHI CUADRADAS
l.-Los valores de x2 son mayores o iguales que O
2.-La forma de una distribución x2 depende del g I =n-l. En consecuencia hay un número infinito de distribuciones x2.
3.-EI área bajo una curva Chi cuadrada y sobre el eje horizontal es 1.
4.-Las distribuciones x2 no son simétricas, tienen colas estrechas que se extienden a la derecha; están sesgadas a la derecha.
5.-cuando n>2 la media de una distribución x2 es n-l y la varianza es 2(n-l). 6.-EI valor modal de una distribución x2 se da en el valor (n-3).
SUPUESTOS Y RESTRICCIONES
SUPUESTOS PARA LA PRUEBA DE (2
Experimento multinominal. Lo que se satisface tomando una muestra aleatoria de la población de interés.
El tamaño de muestra es lo suficientemente grande para que el número esperado en las categorías sea ( 5, para asegurar que (2 se aproxime a la distribución real (multinomial).
Se puede recurrir a colapsar categorías contiguas (celdas) con valores esperados menores de 5.
La prueba estadística es:
Donde pio representa la proporción deseada en la i-ésima categoría, Obsi la frecuencia observada en la categoría i y n es el tamaño de la muestra.
La prueba estadística se distribuye como una Ji-Cuadrado con k-1 grados de libertad donde, k es el número de categorías.
Si el valor de la prueba estadística ((2 calculado) es mayor que el valor crítico ((2 de la tabla) se rechaza la hipótesis nula
Ei: frecuencia Esperada de la i-ésima clase
Oi: frecuencia Observada de la i-ésima clase
N: número de clases
k: número de parámetros estimados a partir de la muestra
La chi cuadrada permite al investigador comprobar una hipótesis acerca de una relación entre dos medidas nominales. La lógica x2 es la siguiente: el número total de observaciones en cada columna en cada columna y el número total de observaciones en cada renglón (positivo o negativo) son considerados o fijados y se conoce como frecuencia marginal.
Existen abusos de esta prueba estadística como su empleo en grupos independientes cuyas variables son numéricas, para lo cual debería usarse la t y no convertir los valores ordinales o nominales. Un ejemplo frecuente es usar puntos de corte arbitrariamente como la edad de 45 o 60 años cuando los datos numéricos con la estadística correspondiente nos brindan más información.
Desventajas del método:
1) Deben agruparse aquellas clases con una frecuencia esperada menor o igual a 5 (fe=5), hasta que su suma alcance un valor mayor o igual a 5 (?fe=5).
Por esta restricción, el agrupamiento produce una reducción en el número de clases y es frecuente entonces que el número de grados de libertad no sea suficiente para evaluar estadísticamente el ajuste.
Por ello, Cochran (1954; Snedecor & Cochran, 1967) ha considerado que tal restricción debilita la sensibilidad del test y ha sugerido que los valores esperados no deben ser menores a 1 (?fe=1) y no a 5.
El número de grados de libertad es entonces:
&µ=n° de clase luego de la agrupación –a-1
Teniendo a la interpretación mencionada más abajo.
2) El número de grados de libertad es &µ= n-a-1, donde a es el número de parámetros estimados para ajustar el modelo elegido; de manera que el número mínimo de clases que se pueden comparar es:
3, para el modelo de Poisson. El parámetro de este modelo es ?
(Lambda) y como los grados de libertad de cualquier distribución no pueden ser menores a la unidad (&µ =1):
&µ= n-a-1
Siendo a=?=1 parámetro
&µ= n-2
Por tanto n debe ser = 3
GRAFICOS
GRAFICA DISTRIBUCION JI CUADRADA PARA V= 2, 5, Y 10 GRADOS DE LIBERTAD
Distribución Chi cuadrada para v=2,5 y 10.
La estadística de Ji cuadrada se calcula de la manera siguiente:
Esta fórmula establece que Chi cuadrada, o x2, es la suma que obtendremos si:
1.- Restamos Fe de Fo para cada una de las celdas de la tabla.
2.-Elevamos al cuadrado cada una de las diferencias.
3.- Dividimos cada diferencia al cuadrado entre Fe.
4.-Sumamos los resultados.
La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor (n-3) = (gl-2).
La función de densidad de la distribución X2 está dada por:
para x>0
la cual da valores críticos (gl) para veinte valores especiales de Para denotar el valor crítico de una distribución X2 con gl grados de libertad se usa el símbolo gl); este valor crítico determina a su derecha un área de bajo la curva X2 y sobre el eje horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se localiza 6 gl en el lado izquierdo y a o largo del lado superior de la misma tabla.
La Distribución Chi cuadrada
La Distribución de probabilidad
FORMULA
La fórmula es:
Dónde:
X2 = valor estadístico de ji cuadrada.
fo = frecuencia observada.
fe = frecuencia esperada.
Pasos:
1. Arreglar las observaciones en una tabla de contingencias.
2. Determinar el valor teórico de las frecuencias para cada casilla.
3. Calcular las diferencias entre los valores observados con respecto a los teóricos de cada casilla.
4. Elevar al cuadrado las diferencias y dividirlas entre el valor teórico de la casilla correspondiente.
5. Obtener la sumatoria de los valores anteriores, que es el estadístico X2.
6. Calcular los grados de libertad (gl): gl = (K columnas -1) [H hileras -1].
7. El valor de X2 se compara con los valores críticos de ji cuadrada de la tabla de valores críticos de X2 y de acuerdo con los grados de libertad, y se determina la probabilidad.
8. Decidir si se acepta o rechaza la hipótesis X2c ³ X2t se rechaza Ho.
TABLA DE CONTINGENCIA JI CUADRADA
La tabla Chi cuadrada (X2) se utiliza principalmente:
Para probar si una serie de datos observada, concuerda con el modelo (serie esperada) de la información.
Para probar las diferencias entre las proporciones de varios grupos (tabla de contingencia).
Para todos los casos,
Ho: No hay diferencia o no hay dependencia entre variables
H1: Hay diferencia o si hay dependencia entre variables
Pasos para realizar la tabla de contingencias
Plantear las hipótesis:
H1: al menos dos proporciones son diferentes.
Construir una tabla que contenga los valores observados.
Sumar los totales de los renglones y columnas de los valores observados.
Debajo de cada valor observado poner el valor esperado utilizando la fórmula:
5. Calcular el valor del estadístico de prueba usando la fórmula:
Dónde:
Oij = Valor observado de la celda i,j.
Eij = Valor esperado de la celda i,j
6. Determinar los grados de libertad mediante:
donde
r = número de renglones
c = número de columnas
Calcular el valor crítico en la tabla
Criterio de decisión: si el valor crítico < valor del estadístico de prueba rechazamos Ho
Ejemplo: Al final de un semestre, las calificaciones de matemáticas fueron tabuladas en la siguiente tabla de contingencia de para estudiar la relación entre la asistencia a clase y la calificación obtenida.
Ausencias | Aprobado | No aprobado |
0 – 3 | 135 | 110 |
4 – 6 | 36 | 4 |
7 – 45 | 9 | 6 |
Con, ¿indican los datos que son distintas las proporciones de estudiantes que pasaron en las tres categorías de ausencias?
H0 : p1 = p2 = p3
H1: al menos dos proporciones son diferentes. Los valores Oij = 135, 110… Corresponden a los valores observados, los valores esperados se colocan en las celdas con paréntesis, para calcular los utilizamos la fórmula: Calculamos el valor del estadístico de prueba usando la fórmula:
La tabla siguiente nos ayuda a organizar los cálculos para el estadístico.
Tabla. Cálculos para el estadístico Chi cuadrada
Para determinar el valor crítico del estadístico de prueba procedemos de la siguiente manera:
Determinar los grados de libertad usando la fórmula: , gl = (3-1)(2-1) = 2
El valor crítico del estadístico ji-cuadrada para y g.l. = 2 se denota , En la
tabla ji- cuadrada encontramos que vale 5.991, el valor del estadístico de prueba es =17.44.
Conclusión: Como este estadístico está localizado en la región de rechazo (a la derecha del valor crítico) , rechazamos Ho por lo cual aceptamos la hipótesis alternativa H1: al menos dos proporciones son diferentes. La tasa de aprobación si depende de las asistencias.
Referencia Bibliográfica
http://www.aray1.com/docupdf/ji2.pdf
Http://members.fortunecity.co/bucker4/estadística/pruebaji2mi.htm
Introducción a la Bioestadística. Robert R. Sokal& F. James Rohlf.
http://www.fcv.unlp.edu.ar/sitios- cátedras/2/material/Distribucion%20de%20Ji.pdf
(function() { var scribd = document.createElement(“script”); scribd.type = “text/javascript”; scribd.async = true; scribd.src = “https://www.scribd.com/javascripts/embed_code/inject.js”; var s = document.getElementsByTagName(“script”)[0]; s.parentNode.insertBefore(scribd, s); })()
http://www.naumkreiman.com.ar/test_ji_cuadrado.html
http://www.monografias.com/trabajos27/hipotesis/hipotesis
http://www.unmsm.edu.pe/educacion/postgrado/est_inf_aplicada.pdf
http://www.gastrocancerprev.com.mx/Documentos/MetodoINV/1%20_6_.pdf
http://www.fcv.unlp.edu.ar/sitios-catedras/2/material/Distribucion%20de%20Ji.pdf
http://www.eumed.net/libros/2006c/203/2r.htm
Autor:
Johnny Félix Farfán Pimentel