1.
Introducción
2. Definición y conceptos
previos
3. Tipos de muestreo
3.1 Métodos de muestreo
probabilísticos
3.1.1.- Muestreo aleatorio
simple
3.1.2.- Muestreo aleatorio
sistemático
3.1.3.- Muestreo aleatorio
estratificado
3.1.4.- Muestreo aleatorio por
conglomerados
3.1.5 Muestreo por Rutas
Aleatorias
3.2.- Métodos de muestreo no
probabilísticos
3.2.1.- Muestreo por
cuotas
3.2.2.- Muestreo opinático o
intencional
3.2.3.- Muestreo casual o
incidental
3.2.4.- Bola de nieve
3.2.5 Muestreo
Discrecional
4. Cálculo del tamaño
de la muestra
4.1.- Tamaño de muestra
para estimar la media de la población
5. Técnicas de muestreo sobre
una población
6. Medidas de tendencia central y
dispersión de v.a.
7.
Bibliografía
1. Introducción
El propósito de un estudio estadístico
suele ser, extraer conclusiones acerca de la naturaleza de una
población. Al ser la población grande y no poder ser
estudiada en su integridad en la mayoría de los casos, las
conclusiones obtenidas deben basarse en el examen de solamente
una parte de ésta, lo que nos lleva, en primer lugar a la
justificación, necesidad y definición de las
diferentes técnicas de muestreo.
Los primeros términos obligados a los que debemos
hacer referencia, definidos en el primer capítulo,
serán los de estadístico y
estimador.
Dentro de este contexto, será necesario asumir un
estadístico o estimador como una variable aleatoria con
una determinada distribución, y que será la pieza
clave en las dos amplias categorías de la inferencia
estadística: la estimación y el
contraste de hipótesis.
El concepto de
estimador, como herramienta fundamental, lo caracterizamos
mediante una serie de propiedades que nos servirán para
elegir el “mejor" para un determinado parámetro de una
población, así como algunos métodos
para la obtención de ellos, tanto en la estimación
puntual como por intervalos.
¿Cómo deducir la ley de probabilidad
sobre determinado carácter de una población cuando
sólo conocemos una muestra?
Este es un problema al que nos enfrentamos cuando por
ejemplo tratamos de estudiar la relación entre el
fumar y el cáncer de pulmón e
intentamos extender las conclusiones obtenidas sobre una muestra al resto
de individuos de la población.
La tarea fundamental de la estadística inferencial, es hacer
inferencias acerca de la población a partir de una muestra
extraída de la misma.
2. Definición y
conceptos previos
En la investigación científica es habitual
que se empleen muestras como medio de acercarse al conocimiento
de la realidad. Sin embargo, para que esto sea posible , para que
a través de las muestras sea posible reproducir el universo con
la precisión que se requiera en cada caso es necesario que
el diseño
muestral se atenga a los principios
recogidos en las técnicas de muestreo.
Antes de pasar describir algunos de los métodos de
muestreo más habituales introduzcamos algunos conceptos
importantes en este contexto:
Población: Es todo conjunto de elementos,
finito o infinito, definido por una o más características, de las que gozan todos los
elementos que lo componen, y sólo ellos.
En muestreo se entiende por población a la
totalidad del universo que
interesa considerar , y que es necesario que esté bien
definido para que se sepa en todo momento que elementos lo
componen.
No obstante, cuando se realiza un trabajo puntual,
conviene distinguir entre 0 : conjunto de elementos accesibles en
nuestro estudio.
Censo: En ocasiones resulta posible estudiar cada
uno de los elementos que componen la población,
realizándose lo que se denomina un censo, es decir, el
estudio de todos los elementos que componen la
población.
La realización de un censo no siempre es posible,
por diferentes motivos: a) economía: el estudio
de todos los elementos que componen una población, sobre
todo si esta es grande, suele ser un problema costoso en tiempo, dinero, etc;
b) que las pruebas a las
que hay que someter a los sujetos sean destructivas; c) que la
población sea infinita o tan grande que exceda las
posibilidades del investigador.
Si la numeración de elementos, se realiza sobre
la población accesible o estudiada, y no sobre la
población teórica, entonces el proceso recibe
el nombre de marco o espacio muestral.
Muestra: En todas las ocasiones en que no es
posible o conveniente realizar un censo, lo que hacemos es
trabajar con una muestra, entendiendo por tal una parte
representativa de la población. Para que una muestra sea
representativa, y por lo tanto útil, debe de reflejar las
similitudes y diferencias encontradas en la población,
ejemplificar las características de la misma. Cuando decimos
que una muestra es representativa indicamos que reúne
aproximadamente las características de la población
que son importantes para la investigación.
a. Población
Los estadísticos usan la palabra población
para referirse no sólo a personas si no a todos los
elementos que han sido escogidos para su estudio.
b. Muestra
Los estadísticos emplean la palabra muestra para
describir un porción escogida de la población.
Matemáticamente, podemos describir muestras y poblaciones
al emplear mediciones como la Media, Mediana, la moda, la
desviación estándar. Cuando éstos
términos describen una muestra se denominan estadísticas.
Una estadística es una característica de
una muestra, los estadísticos emplean letras latinas
minúsculas para denotar estadísticas y muestras.
Los autores proponen diferentes criterios de
clasificación de los diferentes tipos de muestreo, aunque
en general pueden dividirse en dos grandes grupos:
métodos de muestreo probabilísticos y
métodos de muestreo no probabilísticos.
- Muestreos Probabilísticos:
- Aleatorio Simple
- Aleatorio Sistemático
- Estratificado
- por Conglomerados
- Polietápico
- por Ruta Aleatoria
- Muestreos No
Probabilísticos: - de Conveniencia
- de Juicios
- por Cuotas
- de Bola de Nieve
- Discrecional
3.1 Métodos de
muestreo probabilísticos
Los métodos de muestreo probabilísticos
son aquellos que se basan en el principio de equiprobabilidad. Es
decir, aquellos en los que todos los individuos tienen la misma
probabilidad
de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamaño n
tienen la misma probabilidad de ser elegidas. Sólo estos
métodos de muestreo probabilísticos nos aseguran la
representatividad de la muestra extraída y son, por tanto,
los más recomendables. Dentro de los métodos de
muestreo probabilísticos encontramos los siguientes
tipos:
3.1.1.- Muestreo
aleatorio simple: El procedimiento
empleado es el siguiente: 1) se asigna un número a cada
individuo de la población y 2) a través de
algún medio mecánico (bolas dentro de una bolsa,
tablas de números aleatorios, números aleatorios
generados con una calculadora u ordenador, etc) se eligen tantos
sujetos como sea necesario para completar el tamaño de
muestra requerido.
Este procedimiento,
atractivo por su simpleza, tiene poca o nula utilidad
práctica cuando la población que estamos manejando
es muy grande.
3.1.2.- Muestreo aleatorio
sistemático: Este procedimiento exige, como el
anterior, numerar todos los elementos de la población,
pero en lugar de extraer n números aleatorios sólo
se extrae uno. Se parte de ese número aleatorio i, que es
un número elegido al azar, y los elementos que integran la
muestra son los que ocupan los lugares i, i+k, i+2k,
i+3k,…,i+(n-1)k, es decir se toman los individuos de k en k,
siendo k el resultado de dividir el tamaño de la
población entre el tamaño de la muestra: k=N/n. El
número i que empleamos como punto de partida será
un número al azar entre 1 y k.
El riesgo se este
tipo de muestreo está en los casos en que se dan
periodicidades en la población ya que al elegir a los
miembros de la muestra con una periodicidad constante (k) podemos
introducir una homogeneidad que no se da en la población.
Imaginemos que estamos seleccionando una muestra sobre listas de
10 individuos en los que los 5 primeros son varones y los 5
últimos mujeres, si empleamos un muestreo aleatorio
sistemático con k=10 siempre seleccionaríamos o
sólo hombres o sólo mujeres, no podría haber
una representación de los dos sexos.
3.1.3.- Muestreo
aleatorio estratificado: Trata de obviar las dificultades
que presentan los anteriores ya que simplifican los procesos y
suelen reducir el error muestral para un tamaño dado de la
muestra. Consiste en considerar categorías típicas
diferentes entre sí (estratos) que poseen gran
homogeneidad respecto a alguna característica (se puede
estratificar, por ejemplo, según la profesión, el
municipio de residencia, el sexo, el estado
civil, etc). Lo que se pretende con este tipo de muestreo es
asegurarse de que todos los estratos de interés
estarán representados adecuadamente en la muestra. Cada
estrato funciona independientemente, pudiendo aplicarse dentro de
ellos el muestreo aleatorio simple o el estratificado para elegir
los elementos concretos que formarán parte de la muestra.
En ocasiones las dificultades que plantean son demasiado grandes,
pues exige un conocimiento
detallado de la población. (tamaño
geográfico, sexos, edades,…).
La distribución de la muestra en
función de los diferentes estratos se denomina
afijación, y puede ser de diferentes tipos:
Afijación Simple: A cada estrato le
corresponde igual número de elementos
muestrales.
Afijación Proporcional: La
distribución se hace de acuerdo con el peso
(tamaño) de la población en cada
estrato.
Afijación Optima: Se tiene en cuenta la
previsible dispersión de los resultados, de modo que se
considera la proporción y la desviación
típica. Tiene poca aplicación ya que no se suele
conocer la desviación.
3.1.4.-
Muestreo aleatorio por conglomerados: Los métodos
presentados hasta ahora están pensados para seleccionar
directamente los elementos de la población, es decir, que
las unidades muestrales son los elementos de la población.
En el muestreo por conglomerados la unidad muestral es un
grupo de
elementos de la población que forman una unidad, a la que
llamamos conglomerado. Las unidades hospitalarias, los
departamentos universitarios, una caja de determinado producto, etc,
son conglomerados naturales. En otras ocasiones se pueden
utilizar conglomerados no naturales como, por ejemplo, las urnas
electorales. Cuando los conglomerados son área
geográficas suele hablarse de "muestreo por
áreas".
El muestreo por conglomerados consiste en seleccionar
aleatoriamente un cierto numero de conglomerados (el necesario
para alcanzar el tamaño muestral establecido) y en
investigar después todos los elementos pertenecientes a
los conglomerados elegidos.
Para finalizar con esta exposición de los
métodos de muestreo probabilísticos es necesario
comentar que ante lo compleja que puede llegar a ser la
situación real de muestreo con la que nos enfrentemos es
muy común emplear lo que se denomina muestreo
polietápico. Este tipo de muestreo se caracteriza por
operar en sucesivas etapas, empleando en cada una de ellas el
método de
muestreo probabilístico más adecuado.
3.1.5 Muestreo por
Rutas Aleatorias
- La selección de los miembros de la muestra se
realiza como parte del trabajo de campo. - Establecida un área de muestreo, se define un
punto de partida, sobre el que se aplica una ruta predefinida
en la que se van seleccionan-do los miembros de la muestra con
arreglo a un procedimiento heurístico. - Busca asegurar una cobertura geográfica de la
muestra y/o suplir la falta de censo. - No es aconsejable en planos no lineales o poco
homogéneos en manzanas y edificación.
3.2.- Métodos
de muestreo no probabilísticos
A veces, para estudios exploratorios, el muestreo
probabilístico resulta excesivamente costoso y se acude a
métodos no probabilísticos, aun siendo conscientes
de que no sirven para realizar generalizaciones, pues no se tiene
certeza de que la muestra extraída sea representativa, ya
que no todos los sujetos de la población tienen la misma
probabilidad de se elegidos. En general se seleccionan a los
sujetos siguiendo determinados criterios procurando que la
muestra sea representativa.
3.2.1.- Muestreo por
cuotas: También denominado en ocasiones
"accidental". Se asienta generalmente sobre la base de un buen
conocimiento de los estratos de la población y/o de los
individuos más "representativos" o "adecuados" para los
fines de la investigación. Mantiene, por tanto,
semejanzas con el muestreo aleatorio estratificado, pero no tiene
el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que
consisten en un número de individuos que reúnen
unas determinadas condiciones, por ejemplo: 20 individuos de 25 a
40 años, de sexo femenino
y residentes en Gijón. Una vez determinada la cuota se
eligen los primeros que se encuentren que cumplan esas
características. Este método se
utiliza mucho en las encuestas de
opinión.
3.2.2.- Muestreo
opinático o intencional: Este tipo de muestreo se
caracteriza por un esfuerzo deliberado de obtener muestras
"representativas" mediante la inclusión en la muestra de
grupos
supuestamente típicos. Es muy frecuente su
utilización en sondeos preelectorales de zonas que en
anteriores votaciones han marcado tendencias de voto.
3.2.3.- Muestreo casual
o incidental: Se trata de un proceso en el
que el investigador selecciona directa e intencionadamente los
individuos de la población. El caso más frecuente
de este procedimiento el utilizar como muestra los individuos a
los que se tiene fácil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos). Un caso
particular es el de los voluntarios.
3.2.4.- Bola de
nieve: Se localiza a algunos individuos, los cuales
conducen a otros, y estos a otros, y así hasta conseguir
una muestra suficiente. Este tipo se emplea muy frecuentemente
cuando se hacen estudios con poblaciones "marginales",
delincuentes, sectas, determinados tipos de enfermos,
etc.
- A criterio del investigador los elementos son
elegidos sobre lo que él cree que pueden aportar al
estudio. - Ej.: muestreo por juicios; cajeros de un banco o un
supermercado; etc.
4. Cálculo
del tamaño de la muestra
A la hora de determinar el tamaño que debe
alcanzar una muestra hay que tomar en cuenta varios factores: el
tipo de muestreo, el parámetro a estimar, el error
muestral admisible, la varianza poblacional y el nivel de
confianza. Por ello antes de presentar algunos casos sencillos de
cálculo
del tamaño muestral delimitemos estos factores.
Parámetro. Son las medidas o datos que se
obtienen sobre la población.
Estadístico. Los datos o medidas
que se obtienen sobre una muestra y por lo tanto una
estimación de los parámetros.
Error Muestral, de estimación o standard. Es la
diferencia entre un estadístico y su parámetro
correspondiente. Es una medida de la variabilidad de las
estimaciones de muestras repetidas en torno al valor de la
población, nos da una noción clara de hasta
dónde y con qué probabilidad una estimación
basada en una muestra se aleja del valor que se
hubiera obtenido por medio de un censo completo. Siempre se
comete un error, pero la naturaleza de la
investigación nos indicará hasta qué medida
podemos cometerlo (los resultados se someten a error muestral e
intervalos de confianza que varían muestra a muestra).
Varía según se calcule al principio o al final. Un
estadístico será más preciso en cuanto y
tanto su error es más pequeño. Podríamos
decir que es la desviación de la distribución
muestral
de un estadístico y su fiabilidad.
Nivel de Confianza. Probabilidad de que la
estimación efectuada se ajuste a la realidad. Cualquier
información que queremos recoger
está distribuida según una ley de
probabilidad (Gauss o Student), así llamamos nivel de
confianza a la probabilidad de que el intervalo construido en
torno a un
estadístico capte el verdadero valor del
parámetro.
Varianza Poblacional. Cuando una población
es más homogénea la varianza es menor y el
número de entrevistas
necesarias para construir un modelo
reducido del universo, o de la
población, será más pequeño.
Generalmente es un valor desconocido y hay que estimarlo a partir
de datos de estudios previos.
4.1.- Tamaño de
muestra para estimar la media de la
población
Veamos los pasos necesarios para determinar el
tamaño de una muestra empleando el muestreo aleatorio
simple. Para ello es necesario partir de dos supuestos: en primer
lugar el nivel de confianza al que queremos trabajar; en segundo
lugar, cual es el error máximo que estamos dispuestos a
admitir en nuestra estimación.
5. Técnicas
de muestreo sobre una población
La teoría del muestreo tiene por
objetivo, el
estudio de las relaciones existentes entre la distribución
de un carácter en dicha población y las
distribuciones de dicho carácter en todas sus
muestras.
Las ventajas de estudiar una población a partir
de sus muestras son principalmente:
Coste reducido:
Si los datos que buscamos los podemos obtener a partir
de una pequeña parte del total de la población, los
gastos de
recogida y tratamiento de los datos serán menores. Por
ejemplo, cuando se realizan encuestas
previas a un referéndum, es más barato preguntar a
4.000 personas su intención de voto, que a
30.000.000;
Mayor rapidez:
Estamos acostumbrados a ver cómo con los
resultados del escrutinio de las primeras mesas electorales, se
obtiene una aproximación bastante buena del resultado
final de unas elecciones, muchas horas antes de que el recuento
final de votos haya finalizado;
Más posibilidades:
Para hacer cierto tipo de estudios, por ejemplo el de
duración de cierto tipo de bombillas, no es posible en la
práctica destruirlas todas para conocer su vida media, ya
que no quedaría nada que vender. Es mejor destruir
sólo una pequeña parte de ellas y sacar
conclusiones sobre las demás.
De este modo se ve que al hacer estadística
inferencial debemos enfrentarnos con dos problemas:
- Elección de la muestra (muestreo),
que es a lo que nos dedicaremos en este
capítulo. - Extrapolación de las conclusiones obtenidas
sobre la muestra, al resto de la población
(inferencia).
El tipo de muestreo más importante es el
muestreo aleatorio, en el que todos los elementos de la
población tienen la misma probabilidad de ser
extraídos; Aunque dependiendo del problema y con el
objetivo de
reducir los costes o aumentar la precisión, otros tipos de
muestreo pueden ser considerados como veremos más
adelante: muestreo sistemático,
estratificado y por
conglomerados.
6.
Medidas de tendencia central y dispersión de
v.a.
De forma análoga podemos definir para
variables aleatorias medidas de centralización,
dispersión, simetría y forma. Por su interés
nos vamos a centrar en dos medidas sobre v.a. que son la
esperanza matemática
que desempeña un papel
equivalente al de la media y el momento central de
segundo orden, también denominado
varianza.
Media, número calculado mediante
determinadas operaciones
utilizando todos los elementos de un conjunto y que sirve para
representar a éste. La media puede recibir distintos
nombres según las operaciones
realizadas para calcularla: media aritmética, media
geométrica, media armónica, entre otras.
Mediana, en estadística, una de las cantidades
utilizadas para representar un conjunto de números.
Colocando todos los valores en
orden creciente o decreciente, la mediana es aquél que
ocupa la posición central.
Moda (estadística), valor que aparece con
más frecuencia en un conjunto dado de números. Por
ejemplo, en el conjunto {3,4,5,6,6,7,10,13} la moda es 6. Si
son dos los números que se repiten con la misma
frecuencia, el conjunto tiene dos modas. Otros conjuntos no
tienen moda.
Desviación estándar, número
que representa el alejamiento de una serie de números de
su valor medio. Se calcula a partir de todas las desviaciones
individuales con respecto de la media. Es un concepto
importante en la mayoría de los cálculos
estadísticos porque es una indicación precisa de la
variabilidad entre un grupo de
números.
Un ejemplo sencillo es considerar las alturas de un
grupo de cinco niños: 1,41, 1,45, 1,50, 1,59 y 1,60 m. La
media de las alturas es 1,51 m. Las desviaciones son las
diferencias con respecto a la media. No se puede utilizar una
media simple de las desviaciones, porque automáticamente
se obtendría un valor de cero (los valores
positivos y negativos se cancelan entre sí), y ésta
es la razón por la que se recurre a un método
más complejo. En la práctica, se promedian los
cuadrados de las desviaciones (los cuadrados son siempre
positivos), y luego se toma la raíz cuadrada. La media de
las desviaciones al cuadrado es 0,00564, y su raíz
cuadrada es 0,075. Ésta es la desviación
típica, que se representa normalmente por el
símbolo s (sigma). Muchos ordenadores y calculadoras de
bolsillo poseen procedimientos
para calcularla directamente, una vez que se han introducido las
series de números.
Otro grupo de niños podría tener alturas
de 1,46, 1,48, 1,51, 1,53 y 1,57 m. La altura promedio es de
nuevo 1,51 m, pero esta vez la desviación
típica es 0,038. El segundo grupo está más
agrupado en torno a la media, y el valor menor de la
desviación típica lo muestra con
claridad.
Si cada desviación individual se simboliza por
xi, y si existen n valores en la
serie, la desviación típica viene dada por la
fórmula:
Análisis de los datos calculados
La muestra la seleccione a las 5:40 p.m. y luego me
ubiqué en la columna #5 línea 40 de la tabla de
números aleatorios estableciendo el siguiente criterio, se
va a leer 15 números aleatorios menores o iguales a 52
leyendo del lado derecho de la columna en forma horizontal hasta
el final de la página y se continuó con la
siguiente línea de la misma manera:
Los resultados de la muestra son:
01 04 07 14 17
18 20 33 34 35
39 45 46 47 49
Explicación sobre los datos
calculados:
Teóricamente el Coeficiente de
Variación(%) debe ser menor del 15% para considerar que la
media es representativa si no lo es, se debe buscar otra medida
de tendencia central como lo es la mediana y la moda. Recomiendo
que la media no es representativa ya que sus valores originales
(valores de los bancos) tienen
mucha dispersión.
El 50% de los bancos
ganó aproximadamente 28 millones o menos y el otro 50% de
los bancos ganó aproximadamente 28 millones o más
ingresos por
intereses en el período del año 1999.
Abad de Servin, a. y Servin Andrade, L.A. (1978).
Introducción al muestreo. Mexico: Limusa.
Azorin, F. (1972). Curso de muestreo y aplicaciones.
Madrid: Aguilar.
Azorin, F. y Sanchez Crespo, J.L. (1986). Métodos
y aplicaciones de muestreo .Madrid: Alianza.
Martinez Arias, M.R.; Macia, A. y Perez Ruy-Diaz, J.
(1989). Psicología Matemática
II. Madrid: UNED.
Pardo, A. y San Martin, R. (1994). Análisis de datos en psicología II.
Madrid: Pirámide.
Rodriguez Osuna, J. (1991). Métodos de muestreo. Madrid:
CIS.
Rodriguez Osuna, J. (1993). Métodos de muestreo.
Casos prácticos. Madrid: CIS.
Manual de La Universidad de
Málaga-España
Texto: Estadística para Administradores, Autor:
Richard Levin y David Rubin.
Enciclopedia Microsoft
Encarta 99
Páginas visitadas en Internet:
www.bancoaliado.com
www.altavista.com
www.panamafinance.com
www.superintendenciadebancos.com
www.bgeneral.com
www.towerbank.com
www.banistmo.com
www.bladex.com
www.bancolat.com
www.banconal.com
Autor:
Gina George de Moreno
ginageorge[arroba]unete.com