7.2 El uso de la base ENES-PISAC
Librerías que utilizaremos en esta sección:
Como hemos señalado en el Capítulo 2, una de las bases de datos públicas y nacionales para el estudio de la movilidad social es la Encuesta Nacional sobre la Estructura Social (ENES) desarrollada por el Programa de Investigación sobre la Sociedad Argentina Contemporánea(PISAC). La misma puede ser descargada, junto a los manuales de códigos, siguiendo este link.
Descargaremos las bases de individuos y hogares en formato SPSS.
7.2.1 Algunas consideraciones de la ENES
Antes de comenzar a trabajar con la ENES, señalaremos una serie de cuestiones previas a tener en consideración:
La encuesta cuenta con información socio-ocupacional para todos los miembros de 10 años y más. A su vez, para el análisis de la movilidad social intergeneracional, cuenta con información sociolaboral sobre el/la Principal Sostén del Hogar (PSH) cuando el/la PSH y/o cónyuge del hogar entrevistado tenían 15 años de edad. En otras palabras, podemos observar los patrones de movilidad tanto del/la PSH y cónyuge del hogar.
La encuesta ya provee a los usuarios esquemas de clase social construidos (CSO de Torrado y EGP), en formato desagregado, tanto para los miembros del hogar mayores de 10 años ocupados y desocupados, como para el PSH de origen.
Al igual que con la EPH, necesitaremos pegar la información de la base de hogar en la base de individuos, ya que los datos de movilidad social se encuentra en la primera base.
7.2.2 Abriendo y pegando la base ENES
Para abrir los archivos .sav
nuevamente deberemos llamar al paquete haven
que hemos instalado en el Capítulo 3 y utilizaremos la función read_sav.
enes_ind <- read_sav("bases/ENES_Personas_version_final.sav")
enes_hog <- read_sav("bases/ENES_Hogares_version_final.sav")
Obtenidos ambos datasets
ahora vamos a pegar la base de hogares a la de individuos, utilizando como variables identificadoras a nocues
(Código Identificador de Vivienda) y nhog
(Código Identificador del Hogar).
7.2.3 Recodificación de variables y filtros
Para el análisis de la movilidad social que realizaremos en las dos secciones posteriores necesitaremos recodificar una serie de variables para su correcto tratamiento. Empecemos por la principal, la clase social del/la encuestado/o. En este caso nos basaremos en el esquema EGP, que se encuentra codificado en la variable egp11
—Tabla 7.1—. Al tenerlo en su versión desagregada de 11 clases, necesitaremos reagruparlo de tal forma que queden 5 clases. A continuación mostramos nuestra propuesta de agrupación y las líneas de comando necesarias para hacerlo:
Código | Esquema 11 clases | Esquema 5 clases |
1 | I. Clase de servicios, alta | Clase de servicios |
2 | II. Clase de servicios, baja | |
3 | IIIa. Trabajadores no manuales de rutina, alta | Trabajadores rutinarios |
4 | IIIb. Trabajadores no manuales de servicios y comercio, baja | |
5 | IVa. Autónomos con empleados | Pequeña Burguesía |
6 | IVb. Autónomos sin empleados | |
7 | V. Supervisores de trabajadores manuales | Clase trabajadora calificada |
8 | VI. Trabajadores manuales calificados | |
9 | VIIa. Trabajadores manuales no calificados | Clase trabajadora no calificada |
10 | VIIb. Trabajadores agropecuarios | |
11 | IVc. Autónomos agropecuarios | Pequeña Burguesía |
Fuente: elaboración propia en base Erikson y Goldthorpe (1992) |
enes <- enes %>%
mutate(egp5 = car::recode(egp11, "1:2=1; 3:4=2; 5:6=3; 7:8=4; 9:10=5; 11=3"),
egp5_f = factor(egp5, labels = c("CS", "TR", "PB", "CTC", "CTNC")))
Como bien puede apreciarse, también construimos una variable factor (egp5_f
) ya que posteriormente la necesitaremos al realizar un análisis multivariable. Al estar estudiando movilidad intergeneracional también precisaremos tener clasificados en un esquema de clases al PSH del hogar cuando les encuestades tenían 15 años. En este caso recodificaremos la variable de clase únicamente del PSH encuestado (egp11a
) ya que trabajaremos únicamente con esa población para no complicar el análisis.
enes <- enes %>%
mutate(egp5a = car::recode(egp11a, "1:2=1; 3:4=2; 5:6=3; 7:8=4; 9:10=5; 11=3"),
egp5a_f = factor(egp5a, labels = c("CS", "TR", "PB", "CTC", "CTNC")))
Sumada a estas variables, también recodificaremos el nivel educativo de los encuestados y del hogar de origen y crearemos una variable factor para el género. Puntualmente el nivel educativo quedará codificado en las siguientes categorías: 1. Hasta secundario incompleto; 2. Secundario completo - superior incompleto; 3. Superior completo.
Para establecer el nivel educativo del hogar de origen, seleccionaremos la posición educativa más alta entre el PSH y cónyuge de ese hogar, ya que tenemos dichos datos. Esto es lo que comúnmente se denomina clima educativo. Primero deberemos construir la variable de nivel educativo para cada miembro del hogar de origen (PSH y cónyuge), a través de las variables v240a
(máximo nivel educativo del PSH), v241a
(finalidad del nivel educativo del PSH), v244a
(máximo nivel educativo del cónyuge), v245a
(finalidad del nivel educativo del cónyuge). Luego buscaremos el valor máximo de las dos variables para cada registro, generando un nivel educativo para cada hogar de origen. Para ello usaremos la función pmax
de R
base.
Es recomendable revisar el libro de códigos de la encuesta para poder ver como se clasifican las variables, principalmente aquellas ligadas a la educación.
enes <- enes %>%
mutate(educ = car::recode(nivel_ed, "0:4=1; c(5,6,8)=2; c(7,9)=3; else=NA"),
educ_f = factor(educ, labels = c("Hasta sec. incompleto", "Sec. completo",
"Superior completo")))
enes <- enes %>%
mutate(educ_psh = case_when(v240a <= 2 ~ 1, (v240a == 3 | v240a == 4) & v241a ==
2 ~ 1, (v240a == 3 | v240a == 4) & v241a == 1 ~ 2, (v240a == 5 | v240a ==
6) & v241a == 2 ~ 2, (v240a == 5 | v240a == 6) & v241a == 1 ~ 3, v240a ==
7 ~ 3), educ_con = case_when(v244a <= 2 ~ 1, (v244a == 3 | v244a == 4) &
v245a == 2 ~ 1, (v244a == 3 | v244a == 4) & v245a == 1 ~ 2, (v244a == 5 |
v244a == 6) & v245a == 2 ~ 2, (v244a == 5 | v244a == 6) & v245a == 1 ~ 3,
v244a == 7 ~ 3), educ_hog = pmax(educ_psh, educ_con, na.rm = TRUE), educ_hog_f = factor(educ_hog,
labels = c("Hasta sec. incompleto", "Sec. completo", "Superior completo")))
enes <- enes %>%
mutate(sexo = car::recode(v109, "1=1; 2=2; else=NA"), sexo_f = factor(sexo, labels = c("Varon",
"Mujer")))
Por último generaremos un nuevo dataset que sólo contenga la información del PSH encuestado, ya que es para este miembro que tenemos la información acerca de su origen social. Para ello, aplicaremos el filtro a partir de la variable v111
que nos permite conocer el parentesco de los miembros del hogar. También seleccionaremos a la población mayor a 30 años, ya que en los estudios de movilidad se suele priorizar para el análisis a las poblaciones que ya se encuentran con cierta madurez ocupacional.
Podemos observar los 15 primeros casos de la base para observar el clima educativo se ha construido de manera correcta, calculando el máximo entre el nivel educativo de los padres (PSH y cónyuge) de los encuestades.
# A tibble: 15 × 3
educ_psh educ_con educ_hog
<dbl> <dbl> <dbl>
1 1 1 1
2 1 1 1
3 1 NA 1
4 2 1 2
5 1 1 1
6 1 1 1
7 1 1 1
8 2 2 2
9 1 3 3
10 3 NA 3
11 1 1 1
12 1 2 2
13 1 2 2
14 1 1 1
15 3 3 3