Universidad Nacional de Salta Facultad de Ciencias Económicas, Jurídicas y Sociales Licenciatura en economía Economía Laboral
Aplicación empírica Tema 1: Introducción al curso. Indicadores del mercado laboral Aplicación empírica 2012
Encuesta Permanente de Hogares (EPH) La Encuesta Permanente de Hogares (EPH) es un programa nacional de producción sistemática y permanente de información llevado a cabo el Instituto Nacional de Estadística y Censos (INDEC) que permite conocer las características sociodemográficas y socioeconómicas de la población. La EPH se realiza en centros urbanos de más de 100.000 habitantes. La EPH pasó de un relevamiento puntual a uno continuo: Modalidad puntual (EPHP): desde 1974 hasta el 2003. Se realizaba dos veces al año con una periodicidad semestral: en los meses de mayo y octubre. El ámbito geográfico de cobertura siguió un plan de incorporación progresiva llegando a cubrir 28 aglomerados urbanos que representan el 70% de la población urbana del país. Modalidad continua (EPHC): el relevamiento se realiza a lo largo de todo el año. Se publica cada trimestre y cada semestre. La EPHC trimestral cubre 31 aglomerados urbanos. Actualmente, el tamaño muestral es de 25.000 hogares por trimestre.
Cuestionarios o La EPH puntual tenía dos cuestionarios: • uno para la vivienda y el hogar • otro individual para cada una de las personas sin límite de edad. o La EPH continua consta de tres cuestionarios: • uno de vivienda; • otro de hogar; • uno para cada una de las personas de 10 y más años que conforman el hogar.
Información La encuesta releva información sobre: • características demográficas básicas. • características ocupacionales y de migraciones. • características habitacionales, educacionales y de ingresos. Ver diccionario de la EPH
Diseño de la muestra Los hogares que son encuestados son seleccionados de forma aleatoria en dos etapas de selección: En la primer etapa, dentro de cada aglomerado, se selecciona una cantidad de radios censales o subdivisiones de los mismos (áreas). Cada radio censal está constituido por un conjunto de aproximadamente 300 viviendas. En la segunda etapa se listan todas las viviendas particulares de las áreas seleccionadas (radios censales), para efectuar a partir de ese listado una selección aleatoria de viviendas. Los hogares que habitan esas viviendas son los hogares a encuestar.
Esquema de rotación La EPH renueva periódicamente el conjunto de hogares a encuestar. La forma en que se produce esta renovación se denomina esquema de rotación. En la EPHP aproximadamente el 75 % de las viviendas encuestadas en la onda anterior permanece en la muestra en la onda siguiente.
En la EPHC el esquema de rotación se lo ha llamado 22-2, dado que su funcionamiento es el siguiente: Las viviendas de un área ingresan a la muestra para ser encuestadas en dos trimestres consecutivos. Se retiran por dos trimestres consecutivos. Vuelven a la muestra para ser encuestadas en dos trimestres consecutivos. En el caso del esquema 2-2-2, un hogar puede ser seguido a lo largo de un año y medio.
Ponderación de la muestra Como en toda encuesta por muestreo, las estimaciones que surgen de la EPH están afectadas por : • errores debidos al muestreo (consecuencia de haber encuestado sólo a una fracción de la población) • errores no debidos al muestreo: no respuesta, respuestas incoherentes, etc. Los ponderadores ajustan las estimaciones de la población de cada aglomerado relevado por la EPH para que coincidan con las proyecciones de población realizadas por la Dirección de Estadísticas Poblacionales del INDEC. De esta forma las estimaciones a partir de los datos de la muestra permiten hacer inferencia de la población total que representan.
INTRODUCCIÓN A STATA
*Estas filminas se elaboraron a partir de los apuntes de clase del curso “Seminario de Stata” dictado por Luciano Di Gresia en la Maestría en Economía, Facultad de Ciencias Económicas, Universidad Nacional de La Plata.
Stata • STATA es un sistema que permite la gestión de base de datos y la realización de cálculos estadísticos y econométricos. • Ventaja de STATA: se basa en un lenguaje de programación que respeta una sintaxis.
Comandos (Sintaxis) • Los comandos conforman un lenguaje de comunicación con el programa, por lo que existe una determinada sintaxis que debe ser respetada. • La sintaxis de comandos tiene la siguiente estructura general: comando [varlist] [if] [in] [weight] [, opciones]
La sintaxis comando [varlist] [if] [in] [weight] [, opciones] paso a paso
Sintaxis: comando [varlist] El comando summarize permite obtener una descripción estadística de todas las variables que componen el data set:
summarize El anterior comando puede usarse para obtener la descripción estadística de: •
sólo una variable
summarize edad • ó de más variables
summarize edad edu w Todas estas maneras de indicar variables se denominan en la sintaxis como varlist.
Sintaxis: comando [varlist] [if]
La aplicación de este comando restringe observaciones que cumplen con ciertas restricciones de alguna/s variable/s mediante la utilización del “si condicional” (if en inglés).
Para construir una sentencia condicional existen los siguientes componentes: – Operadores de comparación: • == (igual); • != (no igual); • >, =, 25 & edad< 60)
Sintaxis: comando [varlist] [in] Permite aplicar el comando a un rango de observaciones, de acuerdo al orden del data set. Por ejemplo: sum edad in 1/10 • Aplica el comando a las 10 primeras observaciones del data set.
sum edad in 5/12 • Aplica el comando a las observaciones entre la 5ta y la 12da.
sum edad in -10/-1 • Aplica el comando a las últimas 10 observaciones.
Sintaxis: comando [varlist] [weight] [if] [, opciones] [weight]: indica la variable que pondera las observaciones de la muestra. Por ejemplo, sum edad [w=pondera] if varon==1 Sintaxis: comando [varlist] [weight] [if] [, opciones] [,
opciones]: algunos comandos adicionales. Por ejemplo,
aceptan
opciones
sum edad [w=pondera] if varon==1, detail tab edad [w=pondera], missing
La sintaxis comando [varlist] [=exp] [if] [in] [weight] [, opciones]
Sintaxis: comando [varlist] [= exp] • Se utiliza generalmente con comandos: generate y replace.
sólo
dos
• El comando generate permite crear una nueva variable en el data set. Por ejemplo: generate edad=.
También puede crearse una variable nueva con valores surgidos de una operación algebraica. Por ejemplo: generate edad2= edad*edad Este comando crea una nueva variable igual a la original multiplicada por ella misma.
• El otro comando que usa [=exp] es replace que permite reemplazar valores de una variable ya creada. Por ejemplo: generate varon=. replace varon=1 if ch04==1 & varon==. Este comando reemplazó por un uno aquellas observaciones que tenían valores nulos o missing, siempre que cumpla con la condición exigida.
Otros comandos básicos Comando tabulate: permite tabular cantidades de observaciones según distintos valores de una o dos variables. Por ejemplo: tabulate varon ó tabulate varon ch04. • Comando table: permite obtener una tabla con distintas estadísticas. Por ejemplo: table varon, c(mean w). • Comando tabstat: permite obtener la descripción estadística de variables. Por ejemplo: tabstat w, statistics(mean sum count max min range sd variance cv p10 median) • Comandos “destructivos”: eliminan variables u observaciones de variables. Por ejemplo: clear ó drop if edad