Efectos fijos y aleatorios
Roberto Montero Granados
Universidad de Granada junio de 2011
1. Introducción
Los datos de panel1 combinan cortes transversales (información de varios individuos en un momento dado) durante varios períodos de tiempo. El disponer de datos de panel constituye una ventaja y un inconveniente: • • ventaja porque disponemos de más datos y se puede hacer un seguimiento de cada individuo. inconveniente porque si todas las cualidades relevantes del individuo NO son observables entonces los errores individuales estarán correlacionados con las observaciones y los MCO serán inconsistentes. Supongamos que el modelo que pretendemos estimar es el siguiente: yit = X it β + ε it si no se disponen de …ver más…
Eso suele ocurrir cuando tomamos una muestra de un gran universo de individuos. Por ejemplo sabemos que los niños aprueban más si estudian más y sabemos que hay niños más inteligentes que otros entonces supondremos que cada niño parte de un punto de origen distinto (probablemen superior para los individuos más inteligentes) y, a partir de ahí, existe una relación entre trabajo y calificaciones. Sin embargo no podemos evaluar a todos los niños del mundo sino sólo una muestra. En este caso es evidente que, es posible que, si en lugar de escoger esa muestra hubiésemos elegido otra los resultados del origen y de la pendiente fuesen distintos, es decir no estamos seguros del origen del que parten lo niños en función de su coeficiente intelectual, pues ¡ala! ya tenemos una vi aleatoria.
4. Pruebas de especificación
Surgen entonces dos dudas: ¿Cuando debemos aplicar un MCO Pooled y cuando un modelo de datos anidados y, en este último caso, de entre los dos posibles cual de ambos es más procedente? Para solucionarlas debemos responder a varias preguntas: a) ¿la varianza de vi es significativamente distinta de cero? Si la respuesta es afirmativa implica que efectivamente existe un componente inobservable de la varianza asociada a cada individuo y que MCO estará sesgado. Es decir el test de regresión anidada versus regresión agrupada (pooled) consiste en estimar si cada individuo tiene un origen en ordenadas distinto mediante la estimación de