Monografias.com > Estadística > Matemáticas
Descargar Imprimir Comentar Ver trabajos relacionados

Prueba de independencia




Enviado por joseperezleal



    1. Prueba de
      independencia
    2. Corrección de yates para
      tablas de contingencia de 2×2
    3. Prueba de
      homogeneidad
    4. Análisis de la
      varianza
    5. Anova con un
      factor
    6. Rutina general de un
      análisis de varianza
    7. Importancia del software en
      el análisis de datos

    INTRODUCCIÓN

    Existe una variedad de procedimiento
    para el procesamiento y análisis estadístico de datos, una vez
    recogidos los datos, procesados
    y convertidos en información valiosa para el estudio que se
    realiza, pueden utilizarse varias técnicas
    que permitan sacar el máximo provecho de la información disponible, sin embargo, la
    utilización de técnicas
    de Estadística No Parametricas son poco
    utilizada, a pesar de la potencia y
    certeza de sus resultados, y que por lo general no se dispone de
    información suficiente sobre la población de la cual se extrajeron los
    datos que den soporte la realización de inferencia con
    base en la muestra
    observada.

    En esta investigación se desarrollan algunas
    técnicas de análisis estadístico no
    paramétrico tales como la prueba de independencia,
    la corrección de Yates en tablas de contingencia de 2×2,
    las pruebas de
    homogeneidad y se hace un estudio sobre el análisis de
    varianza por medio de la tabla ANOVA, analizando la rutina
    general de este tipo de análisis, para terminar con
    comentarios sobre la importancia del software en este tipo de
    análisis.

    Palabras Claves:
    Estadística No Paramétrica
    Prueba de Independencia
    Corrección de Yates
    Análisis de Varianza
    ANOVA
    Prueba de Homogeneidad

    PRUEBA DE INDEPENDENCIA

    Cuando cada individuo de la población a estudio se puede clasificar
    según dos criterios A y B, admitiendo el primero a
    posibilidades diferentes y b el segundo, la representación
    de las frecuencias observadas en forma de una matriz a x b
    recibe el nombre de Tabla de contingencia. Los datos se disponen
    de la forma

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    siendo nij el número de individuos que
    presentan simultáneamente la i-ésima modalidad del
    carácter A y la j-ésima del
    B.

    La hipótesis nula a contrastar admite que
    ambos caracteres, A y B, se presentan de forma independiente en
    los individuos de la población de la cual se extrae la
    muestra;
    siendo la alternativa la dependencia estocástica entre
    ambos caracteres. La realización de esta prueba requiere
    el cálculo
    del estadístico

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    donde:

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    y

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    son las frecuencias absolutas marginales y

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    el tamaño muestral total.

    El estadístico L se distribuye como una con (a –
    1)(b – 1) grados de libertad. El
    contraste se realiza con un nivel de significación del
    5%.

    Ejemplo de
    Aplicación

    Para estudiar la dependencia entre la práctica de
    algún deporte y la
    depresión, se seleccionó una muestra
    aleatoria simple de 100 jóvenes, con los siguientes
    resultados:

     

    Sin depresión

    Con depresión

     

    Deportista

    38

    9

    47

    No deportista

    31

    22

    53

     

    69

    31

    100

    L = (38 – 32,43)2/32,43 + (31 –
    36,57)2/36,57 + (9 – 14,57)2/14,57 +
    (22 – 16,43)2/16,43

    = 0,9567 + 0,8484 + 2,1293 + 1,8883 = 5,8227

    El valor que
    alcanza el estadístico L es 5,8227. Buscando en la tabla
    teórica de Chi Cuadrado para 1 grado de libertad se
    aprecia Lt = 3,84146 < 5,8227 lo que permite
    rechazar la hipótesis de
    independencia
    de caracteres con un nivel de significación del 5%,
    admitiendo por tanto que la práctica deportiva disminuye
    el riesgo de
    depresión.

    CORRECCIÓN DE YATES PARA TABLAS DE
    CONTINGENCIA DE 2X2

    Un caso especial de pruebas de
    independencia es aquel que emplea una tabla de contingencia de
    2×2. Si se utiliza una tabla cuádruple puede aplicarse una
    fórmula simplificada para calcular el Valor L, por
    χ2.

    Supóngase que las frecuencias observadas en una
    tabla de contingencia de 2×2 sean a, b, c y d de la siguiente
    forma:

     

    A

    B

    Total

    X

    a

    b

    a + b

    Y

    c

    d

    c + d

    Total

    a + c

    b + d

    n

    El valor χ2
    puede calcularse entonces con la fórmula
    siguiente:

    que tiene (2 – 1)(2 – 1) = 1 grado de
    libertad

    Con frecuencia se aplica la Corrección de
    Continuidad de Yates, similar a la corrección de
    continuidad de la aproximación normal a la binomial, para
    mejorar la aproximación a la probabilidad
    exacta. El valor χ2 corregido se calcula a partir
    de la siguiente fórmula:

    Ejemplo de
    Aplicación

    En un estudio para determinar si existe relación
    entre el sexo y el
    propósito de elegir una carrera técnica se
    entrevistaron a 120 aspirantes a la universidad. Los
    resultados se observan en la siguiente tabla de
    contingencia:

    Sexo

    Aspira a Carrera
    Técnica

    Total

    Si

    No

    Masculino

    40

    30

    70

    Femenino

    10

    40

    50

    Total

    50

    50

    120

    Se aplicará la fórmula para encontrar
    χ2

    χ2
    = (120(40×40 – 10×30)2)/70x50x50x70 =
    16,56

    De la tabla teórica de Chi Cuadrado se tiene que
    para un grado de libertad el valor de χ2 que
    separa 0,1% superior es 10,828. Por lo tanto, la hipótesis según la cual existe
    independencia entre el sexo y el
    propósito de elegir una carrera técnica debe ser
    rechazada.

    Si se tiene en cuanta la corrección por
    continuidad de Yates se obtiene:

    χ2
    = (120(|40×40 – 10×30| –
    0,5(120))2)/70x50x50x70 = 15,06

    Que es ligeramente inferior al valor antes obtenido,
    pero aun así, la hipótesis de
    independencia debe ser rechazada.

    PRUEBA DE
    HOMOGENEIDAD

    Se plantea el problema de la existencia de homogeneidad
    entre r poblaciones, para lo cual se realizan muestras
    independientes en cada una de ellas. Los datos muestrales vienen
    clasificados en s clases y sus frecuencias absolutas se presentan
    en forma de una matriz r x
    s:

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    siendo nij el número de observaciones
    en la i-ésima población pertenecientes a la
    j-ésima clase.

    Se quiere contrastar la hipótesis nula de que las
    probabilidades asociadas a las s clases son iguales en las r
    poblaciones. El estadístico para este contraste
    es

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    donde

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    es el tamaño muestral para la i-ésima
    población,

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    es la frecuencia marginal de la j-ésima clase
    y

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    es el tamaño muestral total.

    El estadístico L se distribuye como una con (r –
    1)(s – 1) grados de libertad. El contraste se realiza con un
    nivel de significación del 5%.

    Ejemplo de
    Aplicación

    Un estudio sobre caries dental en niños
    de seis ciudades con diferentes cantidades de fluor en el
    suministro de agua, ha
    proporcionado los resultados siguientes:

    Comunidad

    Nº niños
    sin caries

    Nº niños
    con caries

     

    A

    38

    87

    125

    B

    8

    117

    125

    C

    30

    95

    125

    D

    44

    81

    125

    E

    64

    61

    125

    F

    32

    93

    125

     

    216

    534

    750

    L = (38 – 36)2/36 + (8 –
    36)2/36 + (30 – 36)2/36 + (44
    – 36)2/36 + (64 – 36)2/36 +
    (32 – 36)2/36 + (87 – 89)2/89
    (117 – 89)2/89 + (95 –
    89)2/89 + (81 – 89)2/89 + (61
    – 89)2/89 + (93 –
    89)2/89

    L = 0,1111 + 21,7778 + 1,0000 + 1,7778 + 21,7778 +
    0,4444 + 0,0449 + 8,8089 + 0,4045 + 0,7191 + 8,8089 +
    0,1797

    L = 65,85

    Se quiere saber si la incidencia de caries infantil es
    igual en las seis poblaciones.

    La propia tabla hace pensar que la incidencia de la
    enfermedad no es igual en todas las poblaciones; basta observar
    los datos correspondientes a las comunidades B y E. El contraste
    arroja un valor del estadístico L de 65,85, lo que lleva a
    rechazar la hipótesis de homogeneidad y aceptar que el
    diferente contenido de fluor en el suministro del agua puede ser
    la causa de la disparidad en el número de niños
    con caries. El Lt esperado según la tabla de las distribución Chi Cuadrado es 11,0705 que es
    menor 65,85.

    ANÁLISIS DE LA
    VARIANZA

    Del mismo modo que el contraste
    χ2 generalizaba el
    contraste de dos proporciones, es necesario definir un nuevo
    contraste de hipótesis que sea aplicable en aquellas
    situaciones en las que el número de medias se quieren
    comparar sea superior a dos. Es por ello por lo que el
    Análisis de la Varianza, ANOVA surge como una
    generalización del contraste para dos medias de la
    t de Student, cuando el número de muestras a
    contrastar es mayor que dos
    .

    Por ejemplo, supóngase que se tienen 3 muestras
    de diferentes tamaños que se suponen que provienen de tres
    poblaciones normales con la misma varianza:

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    Si se quiere realizar el contraste

    Es decir que la muestras provienen de poblaciones
    independientes unas de las otras, se podría plantear como
    primer método el
    fijar una cantidad α
    próxima a cero y realizar los contrastes siguientes
    con α como nivel de
    significación:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    De modo que se aceptaría H1 y
    se rechazaría H0 sólo si alguna
    de las hipótesis alternativas H1',
    H1'' ó H1''' es
    aceptada y rechazada su correspondiente hipótesis nula. El
    error de tipo I para este contraste es:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Por ello el nivel de significación obtenido para
    este contraste sobre la igualdad de
    medias de tres muestras no es como hubiésemos esperado
    obtener inicialmente, sino. (1 – (1 –
    α)3) Por ejemplo, si se toma un nivel de
    significación α = 0,1 para cada uno de los
    contrastes de igualdad de
    dos medias, se obtendría que el nivel de
    significación (error de tipo I) para el contraste
    de las tres medias es de 1 – 0,93 = 0,27, lo que es
    una cantidad muy alta para lo que se acostumbra usar.

    En consecuencia, no es adecuado realizar el
    contraste de igualdad de medias de varias muestras mediante una
    multitud de contrastes de igualdad de medias de dos
    muestras
    .

    Una técnica que permite realizar el contraste de
    modo conveniente es la que expone en este trabajo y que se
    denomina Análisis de la Varianza.

    ANOVA con un factor

    Se denomina modelo
    factorial con un factor o ANOVA con un factor al modelo
    (lineal) en el que la variable analizada va a depender de un
    sólo factor de tal manera que las causas de su
    variabilidad son englobadas en una componente aleatoria que se
    denomina error experimental:

    Para ver la fórmula seleccione la
    opción "Descargar" del menú superior

    Considérese una variable sobre la que
    actúa un factor que puede presentarse bajo un determinado
    número de niveles, t. Por ejemplo se puede
    considerar un fármaco que se administra a t = 3
    grupos de
    personas y se les realiza cierta medición del efecto causado:

     

    Resultado de la
    medición

    Gripe (nivel 1)

    5

    3

    2

    5

    4

    3

       

    n1 = 6

    Apendicitis (nivel
    2)

    8

    9

    6

    7

    8

    9

    10

    8

    10

    n2 = 8

    Sanos (nivel 3)

    2

    3

    2

    1

    2

    3

    2

      

    n3 = 6

    En este caso los factores que influyen en las
    observaciones son tres: el que la persona padezca
    la gripe, apendicitis, o que esté sana.

    De modo general se pueden representar las t
    muestras (o niveles) del siguiente modo:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Donde por supuesto, los tamaños de cada muestra
    ni, no tienen por que ser iguales. En este caso
    se dice que se trata del modelo no equilibrado.

    Observación

    De ahora en adelante se asume que las siguientes
    condiciones son verificadas por las t muestras:

    • Las observaciones proceden de poblaciones
      normales;
    • Las t muestras son aleatorias e
      independientes. Además, dentro de cada nivel las
      observaciones son independientes entre sí.
    • En el modelo de un factor se supone que las
      observaciones del nivel i, xij,
      provienen de una variable Xij de forma que
      todas tienen la misma varianza; Hipótesis de
      Homocedasticidad:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    o lo que es lo mismo,

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    De este modo
    μi es el valor
    esperado para las observaciones del nivel i, y los errores
    eij son variables
    aleatorias independientes, con valor esperado nulo, y con el
    mismo grado de dispersión para todas las
    observaciones.

    Otro modo de escribir lo mismo consiste en
    introducir una cantidad μ que sea el valor
    esperado para una persona
    cualquiera de la poblaciσn (sin tener en cuenta los
    diferentes niveles), y considerar los efectos
    αi introducidos por
    los niveles, de modo que

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Especificación del
    modelo

    Con todo lo anterior, el modelo ANOVA de un factor puede
    escribirse como

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    y con la siguiente interpretación:

    μ es una constante común a todos
    los niveles;

    αi es el
    efecto producido por el i-ésimo nivel. Al sumarlos
    todos deben compensarse los efectos negativos con los positivos
    para que la media común a todos los niveles sea realmente
    μ. Esto implica en particular que los efectos,
    αi, de los niveles no
    son independientes;

    eij es la parte de la variable
    Xij no explicada por μ ni
    αi, y que se
    distribuye del mismo modo (aunque independientemente) para cada
    observación, según la ley
    Gaussiana:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Ésta es la condición de homocedasticidad,
    y es fundamental en el análisis de la varianza.

    Obsérvese que ahora se puede escribir el
    contraste de que los diferentes niveles no tienen influencia
    sobre la observación de la variable como

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    o bien

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Observación

    Se utiliza el nombre de análisis de la
    varianza
    ya que el elemento básico del
    análisis estadístico será precisamente el
    estudio de la variabilidad. Teóricamente es posible
    dividir la variabilidad de la variable que se estudia en dos
    partes:

    La originada por el factor en
    cuestión;

    La producida por los restantes factores que entran en
    juego,
    conocidos o no, controlables o no, que se conocen con el nombre
    de error experimental.

    Si mediante los contrastes estadísticos adecuados
    la variación producida por cierto factor es
    significativamente mayor que la producida por el error
    experimental se puede aceptar la hipótesis de que los
    distintos niveles del factor actúan de forma
    distinta.

    Ejemplo: Considérese dos muestras tomadas
    en diferentes niveles de una variable, de forma que ambas tengan
    la misma varianza muestral (lo que indica que no se puede
    rechazar la igualdad de varianzas poblacionales) y medias
    muestrales bastante diferentes. Por ejemplo:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    La dispersión calculada al medir la de los dos
    niveles conjuntamente es mucho mayor que la de cada uno de ellos
    por separado. Por tanto puede deducirse que ambos niveles no
    tienen el mismo valor esperado.

    Algo de notación
    relativa al modelo

    A continuación se va a introducir alguna
    notación para escribir los términos que
    serán más importantes a la hora de realizar un
    contraste por el método
    ANOVA. En primer lugar se tiene:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Usando estos términos se va a desglosar la
    variación total de la muestra en variación total
    dentro de cada nivel (intravariación) más la
    variación entre los distintos niveles
    (intervariación).

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Donde:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Observación

    En el cálculo
    del estadístico SCT intervienen N cantidades,
    ligadas por una relación:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    De este modo el número de grados de libertad de
    este estadístico es N – 1 Por razones
    análogas se tiene que el número de grados de
    libertad de SCD es N – t y el de SCE es t
    –1
    Así introducimos los siguientes
    estadísticos:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Estos son los estadísticos que realmente
    interesan a la hora de realizar el contraste de igualdad de
    medias. Cuando la diferencia entre los efectos de los diferentes
    niveles sea muy baja, es de esperar que la cuasivarianza total
    sea próxima a la intravarianza, o lo que es lo mismo, que
    la intervarianza sea pequeña en relación con la
    intravarianza.

    Figura: En la figura de superior no
    existe una evidencia significativa en contra de que las medias de
    los tres grupos de
    observaciones coinciden. En la figura inferior
    sí.

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    RUTINA GENERAL DE UN ANÁLISIS DE
    VARIANZA

    Considérese el contraste

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Y suponiendo que se está en las condiciones del
    modelo factorial de un factor. Si H0 es cierta
    se puede demostrar que el siguiente estadístico se
    distribuye como una de Snedecor:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Luego si al calcular Fexp obtenemos
    que donde es un nivel de significación dado, deberemos de
    rechazar la hipótesis nula (ya que si H0
    fuese cierta, era de esperar que fuese pequeño en
    relación con ).

    Método reducido para el
    análisis de un factor

    En este apartado se va a resumir lo más
    importante de lo visto hasta ahora, indicando la forma más
    sencilla de realizar el contraste. En primer lugar se calculan
    los siguientes estadísticos a partir de la tabla de las
    observaciones en cada nivel:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Entonces las siguientes cantidades admiten una
    expresión muy sencilla:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Se calcula

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Y dado el nivel de significación α buscamos
    en una tabla de la distribución F de Snedecor el
    valor

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Se rechaza H0 si
    Fexp>Fteo, como se aprecia
    en la Figura

    Figura: Región crítica en
    un contraste ANOVA.

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    Ejemplo: Se aplican 4 tratamientos
    distintos a 4 grupos de 5 pacientes, obteniéndose los
    resultados de la tabla que se adjunta. Queremos saber si se puede
    concluir que todos los tratamientos tienen el mismo efecto. Para
    ello vamos a suponer que estamos en condiciones de aplicar el
    modelo de un factor

    Figura: Se rechaza la hipótesis
    de que los tratamientos tienen el mismo efecto en los tres
    grupos.  

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    En conclusión,
    Fexp>Fteo, como se observa
    en la Figura por tanto se ha de rechazar la igualdad de efectos
    de los tratamientos.

    En la Figura se representan las observaciones de cada
    nivel de tratamiento mediante una curva normal cuyos
    parámetros se han estimado puntualmente a partir de las
    observaciones. Obsérvese que las diferencias más
    importantes se encuentran entre Los tratamientos 2 y 4. Esto
    motiva los contrastes de comparaciones múltiples (dos a
    dos), para que, en el caso en que la igualdad de medias sea
    rechazada, se pueda establecer qué niveles tuvieron mayor
    influencia en esta decisión.

    Figura: Las diferencias más
    importantes se encuentran entre los niveles 2 y 4.

    Para ver el gráfico seleccione la
    opción "Descargar" del menú superior

    Análisis de los resultados
    del ANOVA: Comparaciones múltiples

    Una vez contrastado el que existen diferencias
    significativas mediante el análisis de la varianza,
    interesa conocer que niveles del factor son los que han influido
    más para que se de este resultado. Como ilustración, en el último ejemplo se
    ve claramente que los tratamientos segundo y cuarto dan
    resultados muy diferentes, y probablemente de hay venga el que se
    haya rechazado la igualdad de todos los efectos.

    El método más utilizado consiste en
    realizar todas las comparaciones por parejas:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    lo que corresponde a los ya conocidos contrastes de la t
    de Student, que tienen en este caso como estadístico
    experimental a (de nuevo suponiendo la homocedasticidad en todas
    las muestras):

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Ya que la intravarianza ŜD, es un
    estimador de con Nt grados de
    libertad.

    ANOVA de Varios
    Factores

    Se ha estudiado el modelo ANOVA de un factor,
    también denominado modelo de efecto fijo. Existen otros
    modelos
    denominados ANOVA de varios factores que no se van a estudiar
    aquí, pero que van a ser enunciados brevemente.

    Como ilustración se puede escribir el modelo
    ANOVA de dos factores con interacción en el cual se
    tiene

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Si se supone que no hay interacción entre ambos
    factores, es decir, cada factor actúa independientemente
    del otro, se tiene el modelo de efectos
    aditivos
    :

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    En ambos casos se supone que las cantidades son
    independientes para todos los niveles i1 e
    i2 y todos los individuos jdentro de
    esos niveles, estando equidistribuidos y con la misma varianza
    según una ley
    Gaussiana:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    Consideraciones sobre las hipótesis subyacentes
    en el modelo factorial

    Para aplicar el modelo de un factor se ha hecho, entre
    otras, las siguientes suposiciones:

    • Las observaciones de cada muestra han de ser
      independientes y también la de las muestras entre
      sí. Para ello se puede aplicar cualquiera de los
      contrastes no paramétricos de aleatoriedad. En principio
      esta aleatoriedad es algo que es bastante razonable admitir si
      la metodología para elegir los datos
      (muestreo) ha
      sido realizada siguiendo técnicas adecuadas.
    • Los datos han de ser normales en cada una de las
      muestras. Esto es algo que debería ser contrastado
      previamente antes de utilizar el ANOVA de un factor mediante,
      por ejemplo, el test de
      ajuste a la distribución normal mediante el
      estadístico χ2 que ya conocemos, o bien
      el test de
      d'Agostino.
    • Las varianzas de cada muestra son todas iguales, es
      decir:

    Para ver las fórmulas seleccione
    la opción "Descargar" del menú superior

    IMPORTANCIA DEL SOFTWARE EN EL
    ANÁLISIS DE DATOS

    Una de las áreas más afectadas por esta
    revolución
    es la Metodología de Investigación, la Estadística y el
    procesamiento de
    datos En esta área tiene una importancia notable todo
    lo relativo a tecnología de los
    instrumentos y a los programas
    informáticos específicos para el procesamiento y
    análisis de los datos. El crecimiento de la producción relativa a estos aspectos es muy
    grande, y por otro lado, hay mucha instrumentación que no siendo
    específica de la investigación puede tener una
    utilidad
    importante en determinados estudios. Por todo ello incluimos a
    continuación una relación, en absoluto exhaustiva,
    de instrumentos y programas
    informáticos de gran peso en la
    investigación.

    Software de Recolección
    de Datos

    BEHAVE. Permite el registro y
    tratamiento de datos, ofrece posibilidades de representaciones
    gráficas y algunos análisis.
    Behavior Research Methods & Instruments, 9, 452-455,
    1977.

    BOSS. Facilita el registro de
    duraciones en tiempo real,
    frecuencia y secuencia. University of Washington, USA,
    1975.

    CODEX. Un sistema de
    registro y almacenamiento de
    datos que permite trabajar con distintos tipos de datos
    (Secuencias de eventos,
    secuencias de estados, secuencias mixtas de estados y eventos,
    secuencias de intervalos y formatos de campo) ya sea en una
    situación natural o una situación grabada en
    soporte magnético (audio o video). Permite
    trabajar con el flujo de conducta verbal
    recogido. Exporta los datos a los programas SDIS-GSQ para
    análisis secuencial, OBSERVER 3.0, y THEME.
    (Hernández Mendo, 1996b, Hernández Mendo, Anguera
    & Bermúdez-Rivera, 2000) ( http://www.efdeportes.com/soft.htm )

    DATACHRONO. Un sistema
    portátil de registro y almacenamiento de
    datos diseñado en Argentina.
    Jiménez y cols. (1987).

    DATAMYTE. Uno de los registros y
    almacenamiento más conocido con sus más de dos
    décadas de historia y sucesivas
    versiones. Electro/General Corporation, Minnesota,
    USA.

    DART. Sistema de registro en tiempo real
    controlado por computador.
    Behavioural Psychotherapy, 10, 40-47, 1982.

    DCRII. Diseñado para registrar las conductas de
    recién nacidos y sus cuidadores. Behavior Research Methods
    & Instruments, 9, 442-446, 1977.

    MEL. Micro Experimental Laboratory para diseño
    y presentación de estímulos diseñado por
    Pascal. de W.
    Scheneider (1988). Micro Experimental Laboratory. Behavior
    Research Methods, Instruments & Computers, 20(2),
    206-217.

    OBSERVER 3.0. Es un programa
    orientado hacia el registro de datos en computadores compatibles
    y que realiza algunos análisis de retardo. Tiene una
    aplicación adecuada para el sistema CAMERA (Observer's
    Video Tape
    Analysis System). Disponible a través de
    ProGAMMA.

    OS3. Registrador de eventos y tiempo de fácil
    movilidad. Observational Systems Seattle, Washington,
    USA.

    POMS. Versión informática en Turbo Pascal
    para windows de la
    escala de estados
    de humor) realizada por Hernández Mendo y Ramos (1995a) y
    Hernández Mendo y Ramos (1996a). ( http://www.efdeportes.com/soft.htm )

    PROCODER. Sistema para el control de la
    codificación y análisis de datos cuando se realiza
    directamente desde vídeo.

    REJILLA. Versión informática del ejercicio Grid o rejilla
    con números realizada en Turbo Pascal
    para windows por
    Hernández Mendo, y Ramos, R. (1995b, 1995c) Permite la
    evaluación y el entrenamiento de
    la atención amplia-externa y estrecha-externa.
    ( http://www.efdeportes.com/soft.htm )

    PRACS. Permite el registro continuo y análisis de
    datos de un mismo sujeto facilita la realización de un
    histograma sobre las frecuencias y duraciones. Errasti, J.M. y
    Rifá, H. (1990), Departamento de Psicología, Universidad de
    Oviedo.

    TRANSCRIPTOR. Programa para
    codificación de eventos desde video o audio en tiempo
    real. Permite registro de producción verbal. Realiza un primer
    análisis de frecuencias y de medidas primarias.
    Hernández Mendo, A; Ramos, R.; Peralbo, M.; Risso, A.
    (1993) y Peralbo, M.; Risso, A.; Hernández, A.; Ramos, R.
    (1991), Hernández Mendo y Ramos (1996). (
    http://www.efdeportes.com/soft.htm )

    Software de
    Análisis

    ASR. Uno de los programas más completos para
    análisis secuencial de retardo; permite recodificaciones y
    análisis para diseños complejos. Es una
    versión optimizada del paquete ANSEC de V. Quera, Dpto. de
    Metodología de las Ciencias del
    Comportamiento, Universidad de Barcelona.

    BMDP. Paquete estadístico de gran potencia para
    análisis de datos. La versión antigua está
    bajo entorno de MD-DOS aunque existe una actualización en
    windows que llama a la antigua versión

    CONTIME. Análisis de secuencias en tiempo
    continuo. W. Gardner, publicado en Multivariate Behavioral
    Research, 25, 205-206, 1990.

    ELAG. Análisis de retardo, facilita
    recodificaciones, incluye subprogramas para computar fiabilidad
    (kappa). R. Bakeman, publicado en Behavior Research Methods &
    Instrumentation, 15, 530-535, 1983.

    HYPERCARD. Programa multimedia
    desarrollado por Apple Computer en 1987 para su uso en
    computadores Macintosh. El programa es un constructor de software
    que incluye un amplio conjunto de herramientas
    (de dibujo,
    animación, tratamiento de textos, cálculo, base de datos,
    etc.) que facilita la construcción y administración de test informatizados.
    Goodman (1987). Permite la utilización de programas
    generados en distintos lenguajes (Pascal, C,
    Fortran, etc.). No requiere grandes conocimientos de
    informática para su uso.

    ILOG. Análisis log-lineal para datos
    categóricos. R. Bakeman y B.F. Robinson publicado en
    libro-software
    por LEA, 1994.

    LAGS. Programa pionero de análisis de retardo.
    Sackett et al., publicado en Behavioral Research Methods &
    Instrumentation, 11,366-378, 1979.

    LISREL. Programa que permite realizar análisis de
    ecuaciones
    estructurales para falsación de modelos
    causales.

    MADAP. Paquete de programas que incluye una diversidad
    de tratamientos y análisis de datos. Incorpora una
    adaptación de ANSEC. Kinapple, publicado en Behavioral
    Research Methods, Instruments & Computers, 19, 335-337,
    1987.

    SAMPLE-TEST. Son dos programas que permiten hacer
    pruebas de orden, homogeneidad y estacionaridad markovianos.
    Sample construye matrices de
    transición desde muestras de datos y TEST realiza
    análisis desde la salida de SAMPLE. Arundale, publicado en
    Behavioral Method, Instruments & Computers, 16, 335-336,
    1984.

    SAP. Permite la realización de análisis de
    retardo y añade el cómputo de kappa como medida de
    patrones de interacción Wampold, Roll y East, University
    of Utah, Salt Lake City, Utah, USA.

    SATS. Realiza análisis de retardo y otros
    índices secuenciales con datos de eventos, diseñado
    para su aplicación en el análisis de
    transcripciones verbales. P.J. Yoder y J.P. Tap, publicado en
    Behavior Research Methods, Instruments & Computers, 22,
    339-343, 1990.

    SBA. Realiza análisis sobre la base de
    estadísticos de la teoría
    de la información, modelos log-lineales y técnica
    de retardo. Schlundt, publicado en Behavior Research Methods
    & Instruments, 14, 351-352, 1982.

    SEQANA. Realiza análisis de tipo markoviano,
    analizando estructuras
    K-gramm (secuencias de dos, tres, cuatro, etc. elementos). D.
    Kazantzidou y F.Welk (1990), producido por Unisolo, Braunschweig,
    Alemania.

    SDIS-GSQ. Son dos programas comprendidos en un mismo
    paquete. SDIS es un analizador sintáctico de ficheros de
    datos escritos en un lenguaje
    propuesto como estándar para el intercambio de datos
    secuenciales entre investigadores. Los datos son depurados
    mediante SDIS y transformados en formato máquina sobre el
    que GSQ realiza pruebas de orden y retardo, permite realizar todo
    tipo de codificaciones y trabajar con datos concurrentes,
    así como la agregación o división de datos
    de acuerdo con variables
    incluidas en el registro. Ofrece los principales
    estadísticos de utilización en análisis
    secuenciales; también se puede computar la fiabilidad
    mediante kappa. R. Bakeman y V. Quera, publicado en un libro con
    software incluido por Cambridge University Press, en prensa.

    SPAD. Paquete estadístico de gran
    potencia.

    SPSS/PC. Paquete estadístico de gran potencia y
    de relativo fácil uso, permite realizar todo tipo de
    análisis estadístico desde estadística
    descriptiva hasta análisis multivariante como
    análisis factorial, análisis de varianza ANOVA y
    MANOVA, análisis de clusters, análisis de
    correspondencias, etc.

    STARTGRAPHICS. Paquete estadístico de gran
    potencia y fácil uso.

    SYSTAT 5.0. Programa de análisis
    estadístico y gráficos interactivos. AddLink
    Software

    BIBLIOGRAFÍA

    BioMates (2003) Procesamiento de
    Estadístico de Datos Médicos. [Documento en
    Línea] disponible en: http://es.geocities.com/riotorto/nopa/nopa.htm,
    [Consulta: 2004, abril 22]

    Chao, Lincoln (1999) Estadística para las
    Ciencias Administrativas. México. Mc Graw-Hill, Tercera
    Edición

    García, A. Navarro, H. y R. Vélez
    (1995) Estadística II. Madrid
    UNED

    Siegel Sidnay y John Castellan N.
    Estadística No Paramétrica; Aplicada a las
    ciencias de la conducta. México. Editorial
    Trillas

    Universidad de Málaga (s/f)
    Bioestadística; Métodos y Aplicaciones. Malaga
    España. Facultad de Medicina. Universidad de Málaga.
    [Documento en línea] Disponible en:
    http://ftp.medprev.uma.es/libro/html.htm,
    [Consulta: 2004, abril 22]

    Hernández Mendo, Antonio y Raúl
    Ramos Pollán (2001) ¿Qué es la
    informática aplicada a las ciencias del deporte?
    [Documento en línea] disponible en:

    http://www.efdeportes.com/efd33a/informa2.htm
    ,
    Revista Digital – Buenos
    Aires – Año 6 – N° 33 – Marzo de 2001,
    [Consulta: 2004, abril 23]

     

    Realizado por:

    Lic. José Pérez Leal

    Profesor de Estadística Aplicada a la Educación y de
    Probabilidad y
    Estadística Inferencia – UPEL – Maracay
    – Venezuela

    Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

    Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

    Categorias
    Newsletter