- Hipótesis y prueba de
hipótesis - Procedimiento sistemático
para una prueba de hipótesis para una
muestra - Ejemplo en la cual se indican
los pasos a seguir en una prueba de
hipótesis - Bibliografía
Dentro del estudio de la inferencia
estadística, se describe como se puede tomar una
muestra
aleatoria y a partir de esta muestra estimar el valor de un
parámetro poblacional en la cual se puede emplear el
método de
muestreo y el
teorema del valor central lo que permite explicar como a partir
de una muestra se puede inferir algo acerca de una población, lo cual nos lleva a definir y
elaborar una distribución de muestreo de medias
muestrales que nos permite explicar el teorema del limite central
y utilizar este teorema para encontrar las probabilidades de
obtener las distintas medias maestrales de una
población.
Pero es necesario tener conocimiento
de ciertos datos de la
población como la media, la desviación
estándar o la forma de la población, pero a veces
no se dispone de esta información.
En este caso es necesario hacer una estimación
puntual que es un valor que se usa para estimar un valor
poblacional. Pero una estimación puntual es un solo valor
y se requiere un intervalo de valores a esto
se denomina intervalote confianza y se espera que dentro de este
intervalo se encuentre el parámetro poblacional buscado.
También se utiliza una estimación mediante un
intervalo, el cual es un rango de valores en el que se espera se
encuentre el parámetro poblacional
En nuestro caso se desarrolla un procedimiento
para probar la validez de una aseveración acerca de un
parámetro poblacional este método es denominado
Prueba de hipótesis para una
muestra.
2.- HIPOTESIS Y PRUEBA
DE HIPOTESIS
Tenemos que empezar por definir que es una
hipótesis y que es prueba de hipótesis.
Hipótesis es una aseveración de una
población elaborado con el propósito de poner
aprueba, para verificar si la afirmación es razonable se
usan datos.
En el análisis estadístico se hace una
aseveración, es decir, se plantea una hipótesis,
después se hacen las pruebas para
verificar la aseveración o para determinar que no es
verdadera.
Por tanto, la prueba de hipótesis es un
procedimiento basado en la evidencia muestral y la teoría
de probabilidad; se
emplea para determinar si la hipótesis es una
afirmación razonable.
Prueba de una hipótesis: se realiza mediante un
procedimiento sistemático de cinco paso:
Siguiendo este procedimiento sistemático, al
llegar al paso cinco se puede o no rechazar la hipótesis,
pero debemos de tener cuidado con esta determinación ya
que en la consideración de estadística no proporciona evidencia de que
algo sea verdadero. Esta prueba aporta una clase de
prueba más allá de una duda razonable. Analizaremos
cada paso en detalle
Objetivo de la prueba de
hipótesis.
El propósito de la prueba de hipótesis no
es cuestionar el valor calculado del estadístico
(muestral), sino hacer
un juicio con respecto a la diferencia entre
estadístico de muestra y un valor planteado del
parámetro.
3.- Procedimiento
sistemático para una prueba de hipótesis de una
muestra
.Paso 1: Plantear la hipótesis nula Ho y la
hipótesis alternativa H1.
Cualquier investigación estadística implica la
existencia de hipótesis o afirmaciones acerca de las
poblaciones que se estudian.
La hipótesis nula (Ho) se refiere
siempre a un valor especificado del parámetro de
población, no a una estadística de muestra. La
letra H significa hipótesis y el subíndice cero no
hay diferencia. Por lo general hay un "no" en la hipótesis
nula que indica que "no hay cambio"
Podemos rechazar o aceptar Ho.
La hipótesis nula es una afirmación que no
se rechaza a menos que los datos maestrales proporcionen
evidencia convincente de que es falsa. El planteamiento de la
hipótesis nula siempre contiene un signo de igualdad con
respecto al valor especificado del parámetro.
La hipótesis alternativa (H1) es
cualquier hipótesis que difiera de la hipótesis
nula. Es una afirmación que se acepta si los datos
maestrales proporcionan evidencia suficiente de que la
hipótesis nula es falsa. Se le conoce también como
la hipótesis de investigación. El planteamiento de
la hipótesis alternativa nunca contiene un signo de
igualdad con respecto al valor especificado del
parámetro.
Paso 2: Seleccionar el nivel de
significancia.
Nivel de significacia: Probabilidad de rechazar la
hipótesis nula cuando es verdadera. Se le
denota mediante la letra griega α,
tambiιn es denominada como nivel de riesgo, este
termino es mas adecuado ya que se corre el riesgo de rechazar la
hipótesis nula, cuando en realidad es verdadera. Este
nivel esta bajo el control de la
persona que
realiza la prueba.
Si suponemos que la hipótesis planteada es
verdadera, entonces, el nivel de significación
indicará la probabilidad de no aceptarla, es decir,
estén fuera de área de aceptación.
El nivel de
confianza (1-α), indica la
probabilidad de aceptar la hipótesis
planteada, cuando es verdadera en la población.
La distribución de muestreo de la
estadística de prueba se divide en dos regiones, una
región de rechazo (conocida como región crítica) y una región de no rechazo
(aceptación). Si la estadística de prueba cae
dentro de la región de aceptación, no se puede
rechazar la hipótesis nula.
La región de rechazo puede considerarse como el
conjunto de valores de la estadística de prueba que no
tienen posibilidad de presentarse si la hipótesis nula es
verdadera. Por otro lado, estos valores no son tan improbables de
presentarse si la hipótesis nula es falsa. El valor
crítico separa la región de no rechazo de la de
rechazo.
Cualquiera sea la decisión tomada a partir de una
prueba de hipótesis, ya sea de aceptación de la Ho
o de la Ha, puede incurrirse en error:
Un error tipo I se presenta si la
hipótesis nula Ho es rechazada cuando es verdadera y
debía ser aceptada. La probabilidad de cometer un error
tipo I se denomina con la letra alfa
α
Un error tipo II, se denota
con la letra griega β se presenta si la
hipótesis nula es aceptada cuando de hecho es falsa y
debía ser rechazada.
En cualquiera de los dos casos se comete un error al
tomar una decisión equivocada.
En la siguiente tabla se muestran las decisiones que
pueden tomar el investigador y las consecuencias
posibles.
Para que cualquier ensayo de
hipótesis sea bueno, debe diseñarse de forma que
minimice los errores de decisión. En la práctica un
tipo de error puede tener más importancia que el otro, y
así se tiene a conseguir poner una limitación al
error de mayor importancia. La única forma de reducir
ambos tipos de errores es incrementar el tamaño de la
muestra, lo cual puede ser o no ser posible.
La probabilidad de cometer un error de tipo II denotada
con la letra griega beta β,
depende de la diferencia entre los valores
supuesto y real del parámetro de la población. Como
es más fácil encontrar diferencias grandes, si la
diferencia entre la estadística de muestra y el
correspondiente parámetro de población es grande,
la probabilidad de cometer un error de tipo II, probablemente sea
pequeña.
El estudio y las conclusiones que obtengamos para una
población cualquiera, se habrán apoyado
exclusivamente en el análisis de una parte de ésta.
De la probabilidad con la que estemos dispuestos a asumir estos
errores, dependerá, por ejemplo, el tamaño de la
muestra requerida. Las contrastaciones se apoyan en que los datos
de partida siguen una distribución normal
Existe una relación inversa entre la magnitud de
los errores α y β:
conforme a aumenta, β
disminuye. Esto obliga a establecer con cuidado el valor
de a para
las pruebas estadísticas. Lo ideal sería
establecer α y β.En la
práctica se establece el nivel α y para
disminuir el Error β se incrementa el número de
observaciones en la muestra, pues así se acortan los
limites de confianza respecto a la hipótesis planteada
.La meta de las
pruebas estadísticas es rechazar la hipótesis
planteada. En otras palabras, es deseable aumentar cuando
ésta es verdadera, o sea, incrementar lo que se
llama poder de la
prueba (1– β)
La aceptación de la hipótesis planteada debe
interpretarse como que la información aleatoria de la
muestra disponible no permite detectar la falsedad de esta
hipótesis.
Paso 3: Cálculo
del valor estadístico de prueba
Valor determinado a partir de la información
muestral, que se utiliza para determinar si se rechaza la
hipótesis nula., existen muchos estadísticos de
prueba para nuestro caso utilizaremos los estadísticos z y
t. La elección de uno de estos depende de la cantidad de
muestras que se toman, si las muestras son de la prueba son
iguales a 30 o mas se utiliza el estadístico z, en caso
contrario se utiliza el estadístico t.
Tipos de
prueba
a) Prueba bilateral o de
dos extremos: la hipótesis planteada se
formula con la igualdad
Ejemplo
H0 :
µ
= 200
H1 :
µ
≠ 200
b) Pruebas unilateral o de un extremo:
la hipótesis planteada se formula con ≥ o
≤
H0 :
µ
≥
200 H0 : µ ≤ 200
H1 :
µ
< 200 H1 : µ > 200
En las pruebas de hipótesis para la media
(μ), cuando se conoce la
desviación estándar (σ)
poblacional, o cuando el valor de la muestra es grande (30
o más), el valor estadístico de prueba es z y se
determina a partir de:
El valor estadístico z, para muestra grande y
desviación estándar poblacional desconocida se
determina por la ecuación:
En la prueba para una media poblacional con muestra
pequeña y desviación estándar poblacional
desconocida se utiliza el valor estadístico t.
Paso 4: Formular la regla de
decisión
SE establece las condiciones específicas en la
que se rechaza la hipótesis nula y las condiciones en que
no se rechaza la hipótesis nula. La región de
rechazo define la ubicación de todos los valores que son
tan grandes o tan pequeños, que la probabilidad de que se
presenten bajo la suposición de que la hipótesis
nula es verdadera, es muy remota
Distribución muestral del valor
estadístico z, con prueba de una cola a la
derecha
Valor critico: Es el punto de división
entre la región en la que se rechaza la hipótesis
nula y la región en la que no se rechaza la
hipótesis nula.
Paso 5: Tomar una decisión.
En este último paso de la prueba de
hipótesis, se calcula el estadístico de prueba, se
compara con el valor crítico y se toma la decisión
de rechazar o no la hipótesis nula. Tenga presente que en
una prueba de hipótesis solo se puede tomar una de dos
decisiones: aceptar o rechazar la hipótesis nula. Debe
subrayarse que siempre existe la posibilidad de rechazar la
hipótesis nula cuando no debería haberse rechazado
(error tipo I). También existe la posibilidad de que la
hipótesis nula se acepte cuando debería haberse
rechazado (error de tipo II).
4.- Ejemplo en la
cual se indica el procedimiento para la prueba de
hipótesis
Ejemplo
El jefe de la Biblioteca
Especializada de la Facultad de Ingeniería Eléctrica y Electrónica de la UNAC manifiesta que el
número promedio de lectores por día es de 350. Para
confirmar o no este supuesto se controla la cantidad de lectores
que utilizaron la biblioteca durante 30 días. Se considera
el nivel de significancia de 0.05
Datos:
Día | Usuarios | Día | Usuarios | Día | Usuario |
1 | 356 | 11 | 305 | 21 | 429 |
2 | 427 | 12 | 413 | 22 | 376 |
3 | 387 | 13 | 391 | 23 | 328 |
4 | 510 | 14 | 380 | 24 | 411 |
5 | 288 | 15 | 382 | 25 | 397 |
6 | 290 | 16 | 389 | 26 | 365 |
7 | 320 | 17 | 405 | 27 | 405 |
8 | 350 | 18 | 293 | 28 | 369 |
9 | 403 | 19 | 276 | 29 | 429 |
10 | 329 | 20 | 417 | 30 | 364 |
Solución: Se trata de un problema con una media
poblacional: muestra grande y desviación estándar
poblacional desconocida.
Paso 01: Seleccionamos la hipótesis nula y
la hipótesis alternativa
Ho: μ═350
Ha: μ≠ 350
Paso 02: Nivel de confianza o
significancia 95%
α═0.05
Paso 03: Calculamos o determinamos el valor
estadístico de prueba
De los datos determinamos: que el estadístico de
prueba es t, debido a que el numero de muestras es igual a 30,
conocemos la media de la población, pero la
desviación estándar de la población es
desconocida, en este caso determinamos la desviación
estándar de la muestra y la utilizamos en la formula
reemplazando a la desviación estándar de la
población.
Calculamos la desviación estándar muestral
y la media de la muestra empleando Excel, lo cual
se muestra en el cuadro que sigue.
Columna1 | |
Media | 372.8 |
Error típico | 9.56951578 |
Mediana | 381 |
Moda | 405 |
Desviación estándar | 52.4143965 |
Varianza de la muestra | 2747.26897 |
Curtosis | 0.36687081 |
Coeficiente de asimetría | 0.04706877 |
Rango | 234 |
Mínimo | 276 |
Máximo | 510 |
Suma | 11184 |
Cuenta | 30 |
Nivel de confianza (95.0%) | 19.571868 |
Paso 04: Formulación de la regla de
decisión.
La regla de decisión la formulamos teniendo en
cuenta que esta es una prueba de dos colas, la mitad de 0.05, es
decir 0.025, esta en cada cola. el área en la que no se
rechaza Ho esta entre las dos colas, es por consiguiente 0.95. El
valor critico para 0.05 da un valor de Zc = 1.96.
Por consiguiente la regla de decisión: es
rechazar la hipótesis nula y aceptar la hipótesis
alternativa, si el valor Z calculado no queda en la región
comprendida entre -1.96 y +1.96. En caso contrario no se rechaza
la hipótesis nula si Z queda entre -1.96 y
+1.96.
Paso 05: Toma de decisión.
En este ultimo paso comparamos el estadístico de
prueba calculado mediante el Software Minitab que es
igual a Z = 2.38 y lo comparamos con el valor critico de Zc =
1.96. Como el estadístico de prueba calculado cae a la
derecha del valor critico de Z, se rechaza Ho. Por tanto no se
confirma el supuesto del Jefe de la Biblioteca.
One-Sample Z
Test of mu = 350 vs not = 350
The assumed standard deviation = 52.414
N Mean SE Mean 95% CI Z P
30 372.800 9.569 (354.044, 391.556) 2.38
0.017
- Se rechaza la hipótesis nula (Ho),
se acepta la hipótesis alterna
(H1) a un nivel de significancia de
α = 0.05. La prueba resultó ser
significativa. - La evidencia estadística no permite aceptar la
aceptar la hipótesis nula.
Vega, Escuela de
Postgrado, Maestría en Ingeniería de Sistemas.
Lima – Perú 2005.- Apunte de clases (versión digital). Dr. Jorge
Luis Cordova Egocheaga. Universidad
Inca Garcilaso de la - Lind-Marchal-Mason. Estadística para Administración y Economía Edit.
Alfaomrga 11ª Edición Capitulo
10
3.- Alicia Takemoto (monografía.com). Trabajo de
Curso de Estadística UNFV. 2005
Lima-Perú
4.- Hines-Montgomery-Goldsman-Borror. Probabilidad y
Estadística para Ingeniería Edit. CECSA
4ª
Edición. 2005 México.
Capitulo 11
Por:
Ing. Armando Pedro Cruz Ramirez
Universidad Inca Garcilaso de la Vega, Maestría
en Ingeniería de Sistemas
Lima – Perú
Preparada para la asignatura: Modelos
Estadísticos
Primer Ciclo de Maestría en Ingeniería de
Sistemas
Mención Tecnología de la
Información