Amostra complexa
CENTRO DE CIÊNCIAS AGRÁRIAS
DEPARTAMENTO DE ECONOMIA RURAL
ERU 726 - ECONOMETRIA II
1.o Semestre/2008
AULA PRÁTICA
ANÁLISE DE DADOS AMOSTRAIS COMPLEXOS USANDO O STATA
João Ricardo Ferreira de Lima*
Objetivo: introduzir o estudo de dados amostrais complexos, comparando os resultados de dois tipos de análises: a) desconsiderando o plano amostral; b) considerando o plano amostral. Para isto será utilizada a base de dados da PNAD/IBGE para o ano de 2003 e o software Stata.
Conceitos Básicos
1) Amostragem
Amostragem surge da necessidade de obter informações sobre a população, que mesmo sendo finita, pressupõe elevado custo para coleta de todas as observações. O objetivo é, através de …exibir mais conteúdo…
O cálculo da variância dos estimadores, quando se está trabalhando com amostra complexa, faz uso de duas metodologias: a) Linearização, e b) Replicação. Dentre os métodos de linearização, o método de linearização de Taylor (ou método Delta) é um dos mais usados. Na estatística, a aplicação do método de expansão de uma série de Taylor é para obter uma aproximação de um valor de uma função, a qual é difícil de calcular por ser não-linear e se basear na variância desta aproximação para obter a variância da função não-linear. Considere, por exemplo, a expansão de g([pic]) em torno de Y, até o termo de primeira ordem, desprezando o resto, com g sendo não-linear e Y um vetor de totais de R variáveis de pesquisa, além de [pic],
[pic]
com [pic] sendo uma matriz Jacobiana (matriz com as derivadas parciais) KxR, com K=R cuja r-ésima coluna é [pic], para r=1, ..., R. Tomando a V([pic], dado que g(Y) não possui variância de aleatorização (variância referente à distribuição de probabilidade p(s) induzida pelo plano amostral) é possível demonstrar que um estimador consistente de V([pic] pode ser obtido por
[pic]
com a=[pic] e [pic] é o estimador de variância de aleatorização não-viesado de [pic]. Com relação ao método de Replicação, dentre os métodos existentes[2], Bootstrap é bastante utilizado, apesar de ser computação intensivo. Esse método busca gerar uma distribuição de freqüências após a replicação de