- Prueba de
independencia - Corrección de yates para
tablas de contingencia de 2×2 - Prueba de
homogeneidad - Análisis de la
varianza - Anova con un
factor - Rutina general de un
análisis de varianza - Importancia del software en
el análisis de datos
Existe una variedad de procedimiento
para el procesamiento y análisis estadístico de datos, una vez
recogidos los datos, procesados
y convertidos en información valiosa para el estudio que se
realiza, pueden utilizarse varias técnicas
que permitan sacar el máximo provecho de la información disponible, sin embargo, la
utilización de técnicas
de Estadística No Parametricas son poco
utilizada, a pesar de la potencia y
certeza de sus resultados, y que por lo general no se dispone de
información suficiente sobre la población de la cual se extrajeron los
datos que den soporte la realización de inferencia con
base en la muestra
observada.
En esta investigación se desarrollan algunas
técnicas de análisis estadístico no
paramétrico tales como la prueba de independencia,
la corrección de Yates en tablas de contingencia de 2×2,
las pruebas de
homogeneidad y se hace un estudio sobre el análisis de
varianza por medio de la tabla ANOVA, analizando la rutina
general de este tipo de análisis, para terminar con
comentarios sobre la importancia del software en este tipo de
análisis.
Palabras Claves:
Estadística No Paramétrica
Prueba de Independencia
Corrección de Yates
Análisis de Varianza
ANOVA
Prueba de Homogeneidad
Cuando cada individuo de la población a estudio se puede clasificar
según dos criterios A y B, admitiendo el primero a
posibilidades diferentes y b el segundo, la representación
de las frecuencias observadas en forma de una matriz a x b
recibe el nombre de Tabla de contingencia. Los datos se disponen
de la forma
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
siendo nij el número de individuos que
presentan simultáneamente la i-ésima modalidad del
carácter A y la j-ésima del
B.
La hipótesis nula a contrastar admite que
ambos caracteres, A y B, se presentan de forma independiente en
los individuos de la población de la cual se extrae la
muestra;
siendo la alternativa la dependencia estocástica entre
ambos caracteres. La realización de esta prueba requiere
el cálculo
del estadístico
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
donde:
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
y
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
son las frecuencias absolutas marginales y
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
el tamaño muestral total.
El estadístico L se distribuye como una con (a –
1)(b – 1) grados de libertad. El
contraste se realiza con un nivel de significación del
5%.
Para estudiar la dependencia entre la práctica de
algún deporte y la
depresión, se seleccionó una muestra
aleatoria simple de 100 jóvenes, con los siguientes
resultados:
| Sin depresión | Con depresión |
|
Deportista | 38 | 9 | 47 |
No deportista | 31 | 22 | 53 |
| 69 | 31 | 100 |
L = (38 – 32,43)2/32,43 + (31 –
36,57)2/36,57 + (9 – 14,57)2/14,57 +
(22 – 16,43)2/16,43
= 0,9567 + 0,8484 + 2,1293 + 1,8883 = 5,8227
El valor que
alcanza el estadístico L es 5,8227. Buscando en la tabla
teórica de Chi Cuadrado para 1 grado de libertad se
aprecia Lt = 3,84146 < 5,8227 lo que permite
rechazar la hipótesis de
independencia
de caracteres con un nivel de significación del 5%,
admitiendo por tanto que la práctica deportiva disminuye
el riesgo de
depresión.
CORRECCIÓN DE YATES PARA TABLAS DE
CONTINGENCIA DE 2X2
Un caso especial de pruebas de
independencia es aquel que emplea una tabla de contingencia de
2×2. Si se utiliza una tabla cuádruple puede aplicarse una
fórmula simplificada para calcular el Valor L, por
χ2.
Supóngase que las frecuencias observadas en una
tabla de contingencia de 2×2 sean a, b, c y d de la siguiente
forma:
| A | B | Total |
X | a | b | a + b |
Y | c | d | c + d |
Total | a + c | b + d | n |
El valor χ2
puede calcularse entonces con la fórmula
siguiente:
que tiene (2 – 1)(2 – 1) = 1 grado de
libertad
Con frecuencia se aplica la Corrección de
Continuidad de Yates, similar a la corrección de
continuidad de la aproximación normal a la binomial, para
mejorar la aproximación a la probabilidad
exacta. El valor χ2 corregido se calcula a partir
de la siguiente fórmula:
En un estudio para determinar si existe relación
entre el sexo y el
propósito de elegir una carrera técnica se
entrevistaron a 120 aspirantes a la universidad. Los
resultados se observan en la siguiente tabla de
contingencia:
Sexo | |||
Si | No | ||
Masculino | 40 | 30 | 70 |
Femenino | 10 | 40 | 50 |
Total | 50 | 50 | 120 |
Se aplicará la fórmula para encontrar
χ2
χ2
= (120(40×40 – 10×30)2)/70x50x50x70 =
16,56
De la tabla teórica de Chi Cuadrado se tiene que
para un grado de libertad el valor de χ2 que
separa 0,1% superior es 10,828. Por lo tanto, la hipótesis según la cual existe
independencia entre el sexo y el
propósito de elegir una carrera técnica debe ser
rechazada.
Si se tiene en cuanta la corrección por
continuidad de Yates se obtiene:
χ2
= (120(|40×40 – 10×30| –
0,5(120))2)/70x50x50x70 = 15,06
Que es ligeramente inferior al valor antes obtenido,
pero aun así, la hipótesis de
independencia debe ser rechazada.
Se plantea el problema de la existencia de homogeneidad
entre r poblaciones, para lo cual se realizan muestras
independientes en cada una de ellas. Los datos muestrales vienen
clasificados en s clases y sus frecuencias absolutas se presentan
en forma de una matriz r x
s:
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
siendo nij el número de observaciones
en la i-ésima población pertenecientes a la
j-ésima clase.
Se quiere contrastar la hipótesis nula de que las
probabilidades asociadas a las s clases son iguales en las r
poblaciones. El estadístico para este contraste
es
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
donde
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
es el tamaño muestral para la i-ésima
población,
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
es la frecuencia marginal de la j-ésima clase
y
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
es el tamaño muestral total.
El estadístico L se distribuye como una con (r –
1)(s – 1) grados de libertad. El contraste se realiza con un
nivel de significación del 5%.
Un estudio sobre caries dental en niños
de seis ciudades con diferentes cantidades de fluor en el
suministro de agua, ha
proporcionado los resultados siguientes:
Comunidad | Nº niños | Nº niños |
|
A | 38 | 87 | 125 |
B | 8 | 117 | 125 |
C | 30 | 95 | 125 |
D | 44 | 81 | 125 |
E | 64 | 61 | 125 |
F | 32 | 93 | 125 |
| 216 | 534 | 750 |
L = (38 – 36)2/36 + (8 –
36)2/36 + (30 – 36)2/36 + (44
– 36)2/36 + (64 – 36)2/36 +
(32 – 36)2/36 + (87 – 89)2/89
(117 – 89)2/89 + (95 –
89)2/89 + (81 – 89)2/89 + (61
– 89)2/89 + (93 –
89)2/89
L = 0,1111 + 21,7778 + 1,0000 + 1,7778 + 21,7778 +
0,4444 + 0,0449 + 8,8089 + 0,4045 + 0,7191 + 8,8089 +
0,1797
L = 65,85
Se quiere saber si la incidencia de caries infantil es
igual en las seis poblaciones.
La propia tabla hace pensar que la incidencia de la
enfermedad no es igual en todas las poblaciones; basta observar
los datos correspondientes a las comunidades B y E. El contraste
arroja un valor del estadístico L de 65,85, lo que lleva a
rechazar la hipótesis de homogeneidad y aceptar que el
diferente contenido de fluor en el suministro del agua puede ser
la causa de la disparidad en el número de niños
con caries. El Lt esperado según la tabla de las distribución Chi Cuadrado es 11,0705 que es
menor 65,85.
Del mismo modo que el contraste
χ2 generalizaba el
contraste de dos proporciones, es necesario definir un nuevo
contraste de hipótesis que sea aplicable en aquellas
situaciones en las que el número de medias se quieren
comparar sea superior a dos. Es por ello por lo que el
Análisis de la Varianza, ANOVA surge como una
generalización del contraste para dos medias de la
t de Student, cuando el número de muestras a
contrastar es mayor que dos.
Por ejemplo, supóngase que se tienen 3 muestras
de diferentes tamaños que se suponen que provienen de tres
poblaciones normales con la misma varianza:
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
Si se quiere realizar el contraste
Es decir que la muestras provienen de poblaciones
independientes unas de las otras, se podría plantear como
primer método el
fijar una cantidad α
próxima a cero y realizar los contrastes siguientes
con α como nivel de
significación:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
De modo que se aceptaría H1 y
se rechazaría H0 sólo si alguna
de las hipótesis alternativas H1',
H1'' ó H1''' es
aceptada y rechazada su correspondiente hipótesis nula. El
error de tipo I para este contraste es:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Por ello el nivel de significación obtenido para
este contraste sobre la igualdad de
medias de tres muestras no es como hubiésemos esperado
obtener inicialmente, sino. (1 – (1 –
α)3) Por ejemplo, si se toma un nivel de
significación α = 0,1 para cada uno de los
contrastes de igualdad de
dos medias, se obtendría que el nivel de
significación (error de tipo I) para el contraste
de las tres medias es de 1 – 0,93 = 0,27, lo que es
una cantidad muy alta para lo que se acostumbra usar.
En consecuencia, no es adecuado realizar el
contraste de igualdad de medias de varias muestras mediante una
multitud de contrastes de igualdad de medias de dos
muestras.
Una técnica que permite realizar el contraste de
modo conveniente es la que expone en este trabajo y que se
denomina Análisis de la Varianza.
Se denomina modelo
factorial con un factor o ANOVA con un factor al modelo
(lineal) en el que la variable analizada va a depender de un
sólo factor de tal manera que las causas de su
variabilidad son englobadas en una componente aleatoria que se
denomina error experimental:
Para ver la fórmula seleccione la
opción "Descargar" del menú superior
Considérese una variable sobre la que
actúa un factor que puede presentarse bajo un determinado
número de niveles, t. Por ejemplo se puede
considerar un fármaco que se administra a t = 3
grupos de
personas y se les realiza cierta medición del efecto causado:
Resultado de la | ||||||||||
Gripe (nivel 1) | 5 | 3 | 2 | 5 | 4 | 3 | n1 = 6 | |||
Apendicitis (nivel | 8 | 9 | 6 | 7 | 8 | 9 | 10 | 8 | 10 | n2 = 8 |
Sanos (nivel 3) | 2 | 3 | 2 | 1 | 2 | 3 | 2 | n3 = 6 |
En este caso los factores que influyen en las
observaciones son tres: el que la persona padezca
la gripe, apendicitis, o que esté sana.
De modo general se pueden representar las t
muestras (o niveles) del siguiente modo:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Donde por supuesto, los tamaños de cada muestra
ni, no tienen por que ser iguales. En este caso
se dice que se trata del modelo no equilibrado.
De ahora en adelante se asume que las siguientes
condiciones son verificadas por las t muestras:
- Las observaciones proceden de poblaciones
normales; - Las t muestras son aleatorias e
independientes. Además, dentro de cada nivel las
observaciones son independientes entre sí. - En el modelo de un factor se supone que las
observaciones del nivel i, xij,
provienen de una variable Xij de forma que
todas tienen la misma varianza; Hipótesis de
Homocedasticidad:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
o lo que es lo mismo,
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
De este modo
μi es el valor
esperado para las observaciones del nivel i, y los errores
eij son variables
aleatorias independientes, con valor esperado nulo, y con el
mismo grado de dispersión para todas las
observaciones.
Otro modo de escribir lo mismo consiste en
introducir una cantidad μ que sea el valor
esperado para una persona
cualquiera de la poblaciσn (sin tener en cuenta los
diferentes niveles), y considerar los efectos
αi introducidos por
los niveles, de modo que
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Con todo lo anterior, el modelo ANOVA de un factor puede
escribirse como
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
y con la siguiente interpretación:
μ es una constante común a todos
los niveles;
αi es el
efecto producido por el i-ésimo nivel. Al sumarlos
todos deben compensarse los efectos negativos con los positivos
para que la media común a todos los niveles sea realmente
μ. Esto implica en particular que los efectos,
αi, de los niveles no
son independientes;
eij es la parte de la variable
Xij no explicada por μ ni
αi, y que se
distribuye del mismo modo (aunque independientemente) para cada
observación, según la ley
Gaussiana:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Ésta es la condición de homocedasticidad,
y es fundamental en el análisis de la varianza.
Obsérvese que ahora se puede escribir el
contraste de que los diferentes niveles no tienen influencia
sobre la observación de la variable como
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
o bien
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Se utiliza el nombre de análisis de la
varianza ya que el elemento básico del
análisis estadístico será precisamente el
estudio de la variabilidad. Teóricamente es posible
dividir la variabilidad de la variable que se estudia en dos
partes:
La originada por el factor en
cuestión;
La producida por los restantes factores que entran en
juego,
conocidos o no, controlables o no, que se conocen con el nombre
de error experimental.
Si mediante los contrastes estadísticos adecuados
la variación producida por cierto factor es
significativamente mayor que la producida por el error
experimental se puede aceptar la hipótesis de que los
distintos niveles del factor actúan de forma
distinta.
Ejemplo: Considérese dos muestras tomadas
en diferentes niveles de una variable, de forma que ambas tengan
la misma varianza muestral (lo que indica que no se puede
rechazar la igualdad de varianzas poblacionales) y medias
muestrales bastante diferentes. Por ejemplo:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
La dispersión calculada al medir la de los dos
niveles conjuntamente es mucho mayor que la de cada uno de ellos
por separado. Por tanto puede deducirse que ambos niveles no
tienen el mismo valor esperado.
Algo de notación
relativa al modelo
A continuación se va a introducir alguna
notación para escribir los términos que
serán más importantes a la hora de realizar un
contraste por el método
ANOVA. En primer lugar se tiene:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Usando estos términos se va a desglosar la
variación total de la muestra en variación total
dentro de cada nivel (intravariación) más la
variación entre los distintos niveles
(intervariación).
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Donde:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
En el cálculo
del estadístico SCT intervienen N cantidades,
ligadas por una relación:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
De este modo el número de grados de libertad de
este estadístico es N – 1 Por razones
análogas se tiene que el número de grados de
libertad de SCD es N – t y el de SCE es t
–1 Así introducimos los siguientes
estadísticos:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Estos son los estadísticos que realmente
interesan a la hora de realizar el contraste de igualdad de
medias. Cuando la diferencia entre los efectos de los diferentes
niveles sea muy baja, es de esperar que la cuasivarianza total
sea próxima a la intravarianza, o lo que es lo mismo, que
la intervarianza sea pequeña en relación con la
intravarianza.
Figura: En la figura de superior no
existe una evidencia significativa en contra de que las medias de
los tres grupos de
observaciones coinciden. En la figura inferior
sí.
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
RUTINA GENERAL DE UN ANÁLISIS DE
VARIANZA
Considérese el contraste
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Y suponiendo que se está en las condiciones del
modelo factorial de un factor. Si H0 es cierta
se puede demostrar que el siguiente estadístico se
distribuye como una de Snedecor:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Luego si al calcular Fexp obtenemos
que donde es un nivel de significación dado, deberemos de
rechazar la hipótesis nula (ya que si H0
fuese cierta, era de esperar que fuese pequeño en
relación con ).
Método reducido para el
análisis de un factor
En este apartado se va a resumir lo más
importante de lo visto hasta ahora, indicando la forma más
sencilla de realizar el contraste. En primer lugar se calculan
los siguientes estadísticos a partir de la tabla de las
observaciones en cada nivel:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Entonces las siguientes cantidades admiten una
expresión muy sencilla:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Se calcula
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Y dado el nivel de significación α buscamos
en una tabla de la distribución F de Snedecor el
valor
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Se rechaza H0 si
Fexp>Fteo, como se aprecia
en la Figura
Figura: Región crítica en
un contraste ANOVA.
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
Ejemplo: Se aplican 4 tratamientos
distintos a 4 grupos de 5 pacientes, obteniéndose los
resultados de la tabla que se adjunta. Queremos saber si se puede
concluir que todos los tratamientos tienen el mismo efecto. Para
ello vamos a suponer que estamos en condiciones de aplicar el
modelo de un factor
Figura: Se rechaza la hipótesis
de que los tratamientos tienen el mismo efecto en los tres
grupos.
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
En conclusión,
Fexp>Fteo, como se observa
en la Figura por tanto se ha de rechazar la igualdad de efectos
de los tratamientos.
En la Figura se representan las observaciones de cada
nivel de tratamiento mediante una curva normal cuyos
parámetros se han estimado puntualmente a partir de las
observaciones. Obsérvese que las diferencias más
importantes se encuentran entre Los tratamientos 2 y 4. Esto
motiva los contrastes de comparaciones múltiples (dos a
dos), para que, en el caso en que la igualdad de medias sea
rechazada, se pueda establecer qué niveles tuvieron mayor
influencia en esta decisión.
Figura: Las diferencias más
importantes se encuentran entre los niveles 2 y 4.
Para ver el gráfico seleccione la
opción "Descargar" del menú superior
Análisis de los resultados
del ANOVA: Comparaciones múltiples
Una vez contrastado el que existen diferencias
significativas mediante el análisis de la varianza,
interesa conocer que niveles del factor son los que han influido
más para que se de este resultado. Como ilustración, en el último ejemplo se
ve claramente que los tratamientos segundo y cuarto dan
resultados muy diferentes, y probablemente de hay venga el que se
haya rechazado la igualdad de todos los efectos.
El método más utilizado consiste en
realizar todas las comparaciones por parejas:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
lo que corresponde a los ya conocidos contrastes de la t
de Student, que tienen en este caso como estadístico
experimental a (de nuevo suponiendo la homocedasticidad en todas
las muestras):
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Ya que la intravarianza ŜD, es un
estimador de con N – t grados de
libertad.
Se ha estudiado el modelo ANOVA de un factor,
también denominado modelo de efecto fijo. Existen otros
modelos
denominados ANOVA de varios factores que no se van a estudiar
aquí, pero que van a ser enunciados brevemente.
Como ilustración se puede escribir el modelo
ANOVA de dos factores con interacción en el cual se
tiene
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Si se supone que no hay interacción entre ambos
factores, es decir, cada factor actúa independientemente
del otro, se tiene el modelo de efectos
aditivos:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
En ambos casos se supone que las cantidades son
independientes para todos los niveles i1 e
i2 y todos los individuos jdentro de
esos niveles, estando equidistribuidos y con la misma varianza
según una ley
Gaussiana:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
Consideraciones sobre las hipótesis subyacentes
en el modelo factorial
Para aplicar el modelo de un factor se ha hecho, entre
otras, las siguientes suposiciones:
- Las observaciones de cada muestra han de ser
independientes y también la de las muestras entre
sí. Para ello se puede aplicar cualquiera de los
contrastes no paramétricos de aleatoriedad. En principio
esta aleatoriedad es algo que es bastante razonable admitir si
la metodología para elegir los datos
(muestreo) ha
sido realizada siguiendo técnicas adecuadas. - Los datos han de ser normales en cada una de las
muestras. Esto es algo que debería ser contrastado
previamente antes de utilizar el ANOVA de un factor mediante,
por ejemplo, el test de
ajuste a la distribución normal mediante el
estadístico χ2 que ya conocemos, o bien
el test de
d'Agostino. - Las varianzas de cada muestra son todas iguales, es
decir:
Para ver las fórmulas seleccione
la opción "Descargar" del menú superior
IMPORTANCIA DEL SOFTWARE EN EL
ANÁLISIS DE DATOS
Una de las áreas más afectadas por esta
revolución
es la Metodología de Investigación, la Estadística y el
procesamiento de
datos En esta área tiene una importancia notable todo
lo relativo a tecnología de los
instrumentos y a los programas
informáticos específicos para el procesamiento y
análisis de los datos. El crecimiento de la producción relativa a estos aspectos es muy
grande, y por otro lado, hay mucha instrumentación que no siendo
específica de la investigación puede tener una
utilidad
importante en determinados estudios. Por todo ello incluimos a
continuación una relación, en absoluto exhaustiva,
de instrumentos y programas
informáticos de gran peso en la
investigación.
Software de Recolección
de Datos
BEHAVE. Permite el registro y
tratamiento de datos, ofrece posibilidades de representaciones
gráficas y algunos análisis.
Behavior Research Methods & Instruments, 9, 452-455,
1977.
BOSS. Facilita el registro de
duraciones en tiempo real,
frecuencia y secuencia. University of Washington, USA,
1975.
CODEX. Un sistema de
registro y almacenamiento de
datos que permite trabajar con distintos tipos de datos
(Secuencias de eventos,
secuencias de estados, secuencias mixtas de estados y eventos,
secuencias de intervalos y formatos de campo) ya sea en una
situación natural o una situación grabada en
soporte magnético (audio o video). Permite
trabajar con el flujo de conducta verbal
recogido. Exporta los datos a los programas SDIS-GSQ para
análisis secuencial, OBSERVER 3.0, y THEME.
(Hernández Mendo, 1996b, Hernández Mendo, Anguera
& Bermúdez-Rivera, 2000) ( http://www.efdeportes.com/soft.htm )
DATACHRONO. Un sistema
portátil de registro y almacenamiento de
datos diseñado en Argentina.
Jiménez y cols. (1987).
DATAMYTE. Uno de los registros y
almacenamiento más conocido con sus más de dos
décadas de historia y sucesivas
versiones. Electro/General Corporation, Minnesota,
USA.
DART. Sistema de registro en tiempo real
controlado por computador.
Behavioural Psychotherapy, 10, 40-47, 1982.
DCRII. Diseñado para registrar las conductas de
recién nacidos y sus cuidadores. Behavior Research Methods
& Instruments, 9, 442-446, 1977.
MEL. Micro Experimental Laboratory para diseño
y presentación de estímulos diseñado por
Pascal. de W.
Scheneider (1988). Micro Experimental Laboratory. Behavior
Research Methods, Instruments & Computers, 20(2),
206-217.
OBSERVER 3.0. Es un programa
orientado hacia el registro de datos en computadores compatibles
y que realiza algunos análisis de retardo. Tiene una
aplicación adecuada para el sistema CAMERA (Observer's
Video Tape
Analysis System). Disponible a través de
ProGAMMA.
OS3. Registrador de eventos y tiempo de fácil
movilidad. Observational Systems Seattle, Washington,
USA.
POMS. Versión informática en Turbo Pascal
para windows de la
escala de estados
de humor) realizada por Hernández Mendo y Ramos (1995a) y
Hernández Mendo y Ramos (1996a). ( http://www.efdeportes.com/soft.htm )
PROCODER. Sistema para el control de la
codificación y análisis de datos cuando se realiza
directamente desde vídeo.
REJILLA. Versión informática del ejercicio Grid o rejilla
con números realizada en Turbo Pascal
para windows por
Hernández Mendo, y Ramos, R. (1995b, 1995c) Permite la
evaluación y el entrenamiento de
la atención amplia-externa y estrecha-externa.
( http://www.efdeportes.com/soft.htm )
PRACS. Permite el registro continuo y análisis de
datos de un mismo sujeto facilita la realización de un
histograma sobre las frecuencias y duraciones. Errasti, J.M. y
Rifá, H. (1990), Departamento de Psicología, Universidad de
Oviedo.
TRANSCRIPTOR. Programa para
codificación de eventos desde video o audio en tiempo
real. Permite registro de producción verbal. Realiza un primer
análisis de frecuencias y de medidas primarias.
Hernández Mendo, A; Ramos, R.; Peralbo, M.; Risso, A.
(1993) y Peralbo, M.; Risso, A.; Hernández, A.; Ramos, R.
(1991), Hernández Mendo y Ramos (1996). (
http://www.efdeportes.com/soft.htm )
ASR. Uno de los programas más completos para
análisis secuencial de retardo; permite recodificaciones y
análisis para diseños complejos. Es una
versión optimizada del paquete ANSEC de V. Quera, Dpto. de
Metodología de las Ciencias del
Comportamiento, Universidad de Barcelona.
BMDP. Paquete estadístico de gran potencia para
análisis de datos. La versión antigua está
bajo entorno de MD-DOS aunque existe una actualización en
windows que llama a la antigua versión
CONTIME. Análisis de secuencias en tiempo
continuo. W. Gardner, publicado en Multivariate Behavioral
Research, 25, 205-206, 1990.
ELAG. Análisis de retardo, facilita
recodificaciones, incluye subprogramas para computar fiabilidad
(kappa). R. Bakeman, publicado en Behavior Research Methods &
Instrumentation, 15, 530-535, 1983.
HYPERCARD. Programa multimedia
desarrollado por Apple Computer en 1987 para su uso en
computadores Macintosh. El programa es un constructor de software
que incluye un amplio conjunto de herramientas
(de dibujo,
animación, tratamiento de textos, cálculo, base de datos,
etc.) que facilita la construcción y administración de test informatizados.
Goodman (1987). Permite la utilización de programas
generados en distintos lenguajes (Pascal, C,
Fortran, etc.). No requiere grandes conocimientos de
informática para su uso.
ILOG. Análisis log-lineal para datos
categóricos. R. Bakeman y B.F. Robinson publicado en
libro-software
por LEA, 1994.
LAGS. Programa pionero de análisis de retardo.
Sackett et al., publicado en Behavioral Research Methods &
Instrumentation, 11,366-378, 1979.
LISREL. Programa que permite realizar análisis de
ecuaciones
estructurales para falsación de modelos
causales.
MADAP. Paquete de programas que incluye una diversidad
de tratamientos y análisis de datos. Incorpora una
adaptación de ANSEC. Kinapple, publicado en Behavioral
Research Methods, Instruments & Computers, 19, 335-337,
1987.
SAMPLE-TEST. Son dos programas que permiten hacer
pruebas de orden, homogeneidad y estacionaridad markovianos.
Sample construye matrices de
transición desde muestras de datos y TEST realiza
análisis desde la salida de SAMPLE. Arundale, publicado en
Behavioral Method, Instruments & Computers, 16, 335-336,
1984.
SAP. Permite la realización de análisis de
retardo y añade el cómputo de kappa como medida de
patrones de interacción Wampold, Roll y East, University
of Utah, Salt Lake City, Utah, USA.
SATS. Realiza análisis de retardo y otros
índices secuenciales con datos de eventos, diseñado
para su aplicación en el análisis de
transcripciones verbales. P.J. Yoder y J.P. Tap, publicado en
Behavior Research Methods, Instruments & Computers, 22,
339-343, 1990.
SBA. Realiza análisis sobre la base de
estadísticos de la teoría
de la información, modelos log-lineales y técnica
de retardo. Schlundt, publicado en Behavior Research Methods
& Instruments, 14, 351-352, 1982.
SEQANA. Realiza análisis de tipo markoviano,
analizando estructuras
K-gramm (secuencias de dos, tres, cuatro, etc. elementos). D.
Kazantzidou y F.Welk (1990), producido por Unisolo, Braunschweig,
Alemania.
SDIS-GSQ. Son dos programas comprendidos en un mismo
paquete. SDIS es un analizador sintáctico de ficheros de
datos escritos en un lenguaje
propuesto como estándar para el intercambio de datos
secuenciales entre investigadores. Los datos son depurados
mediante SDIS y transformados en formato máquina sobre el
que GSQ realiza pruebas de orden y retardo, permite realizar todo
tipo de codificaciones y trabajar con datos concurrentes,
así como la agregación o división de datos
de acuerdo con variables
incluidas en el registro. Ofrece los principales
estadísticos de utilización en análisis
secuenciales; también se puede computar la fiabilidad
mediante kappa. R. Bakeman y V. Quera, publicado en un libro con
software incluido por Cambridge University Press, en prensa.
SPAD. Paquete estadístico de gran
potencia.
SPSS/PC. Paquete estadístico de gran potencia y
de relativo fácil uso, permite realizar todo tipo de
análisis estadístico desde estadística
descriptiva hasta análisis multivariante como
análisis factorial, análisis de varianza ANOVA y
MANOVA, análisis de clusters, análisis de
correspondencias, etc.
STARTGRAPHICS. Paquete estadístico de gran
potencia y fácil uso.
SYSTAT 5.0. Programa de análisis
estadístico y gráficos interactivos. AddLink
Software
BioMates (2003) Procesamiento de |
Chao, Lincoln (1999) Estadística para las |
García, A. Navarro, H. y R. Vélez |
Siegel Sidnay y John Castellan N. |
Universidad de Málaga (s/f) |
Hernández Mendo, Antonio y Raúl |
Realizado por:
Lic. José Pérez Leal
Profesor de Estadística Aplicada a la Educación y de
Probabilidad y
Estadística Inferencia – UPEL – Maracay
– Venezuela