4.3 Explorando las variables socio-ocupacionales en la EPH

Paquetes que utilizaremos en esta sección:

library(tidyverse)
library(eph)
library(foreign)

En este apartado aplicaremos lo aprendido en punto anterior y exploraremos las distintas variables revisadas a partir de la EPH. Lo que nos interesa es identificarlas, saber qué nombre tienen y como se presentan sus categorías. Al mismo tiempo, revisaremos algunas de las cuestiones aprendidas en el Capítulo 3. Aprovecharemos a utilizar la base del segundo trimestre de la EPH de 2015, ya que en la misma, excepcionalmente, la ocupación fue codificada tanto a partir del CNO-01 como de la CIUO-08. De esta forma, por un lado descargaremos a través del paquete eph y añadiremos la variable de ocupación descargando la información adicional desde la página de INDEC.

En primer lugar descargamos la base:

eph_ind_215 <- get_microdata(year = 2015, trimester = 2, type = "individual")

Como la codificación de la variable ocupación a partir de la CIUO se encuentra en un archivo aparte, debemos acceder al sitio de INDEC para descargarlo.

Gráfico 4.1: Ejemplo clasificación de Actividades Profesionales, Científicas y Técnicas - CAES 1.0 (INDEC, 2011)

Ejemplo clasificación de Actividades Profesionales, Científicas y Técnicas - CAES 1.0 [@INDEC2011d]

Luego de descargado el archivo, descomprimiremos el .rar y utilizaremos el archivo eph_ciuo_215.dbf. A continuación abriremos dicho archivo y “pegaremos” la variable PP04D_CIUO en la base eph_ind_215. Utilizaremos las variables CODUSU (identificador de vivienda), NRO_HOGAR (identificador del hogar) y COMPONENTE (identificador de miembro del hogar) como ID para emparejar ambas bases.

library(foreign)
eph_ciuo_215 <- read.dbf("bases/eph_ciuo_215.dbf")  #carga de base CIUO
eph_ciuo_215 <- eph_ciuo_215 %>%
    select(CODUSU, NRO_HOGAR, COMPONENTE, PP04D_CIUO)  #selecciono las variables que necesito retener

eph_ind_215 <- eph_ind_215 %>%
    left_join(eph_ciuo_215, by = c("CODUSU", "NRO_HOGAR", "COMPONENTE"))  #Pego la variable CIUO a la base eph_ind_215

Ahora podemos etiquetar la base utilizando el comando organize_labels del paquete eph:

eph_ind_215 <- organize_labels(eph_ind_215, type = "individual")

eph_ind_215$CODUSU <- as.character(eph_ind_215$CODUSU)  #Es necesario convertir a 'character' para futuras operaciones. Esto se hace porque el comando 'organize_labels' le cambia el formato a la variables.

¡Listo! La base está preparada para ser explorada.

4.3.1 Condición de actividad

En la EPH la variable que mide la condición de actividad puede ser encontrada bajo el nombre “ESTADO”. Exploraremos las distintas categorías y frecuencias de casos que presenta para dicho trimestre.

table(eph_ind_215$ESTADO)

Entrevista individual no realizada (no respuesta al cuestionario individual) 
                                                                          63 
                                                                     Ocupado 
                                                                       24398 
                                                                  Desocupado 
                                                                        1450 
                                                                    Inactivo 
                                                                       25138 
                                                          Menor de 10 anios. 
                                                                        8979 

Como puede observarse las categorías son entrevista individual no realizada, ocupado, desocupado, inactivo y menor de 10 años. En el caso de que pretendamos seleccionar únicamente a la población económicamente activa, deberemos filtrar las categorías 1 (ocupado) y 2 (desocupado). En este caso nos quedaríamos con 25848 registros.

eph_2015_PEA <- eph_ind_215 %>%
    filter(ESTADO == 1 | ESTADO == 2)

nrow(eph_2015_PEA)
[1] 25848

4.3.2 Ocupación

Como presentaremos en la próxima unidad, la ocupación es la variable central en la construcción de esquemas de estratificación y clases sociales. En el caso de la EPH, los censos (posteriores a 1991) y las diversas encuestas que produce el INDEC, en las que se releva información ocupacional, suelen codificar dicha variable a través del CNO.

La EPH recaba la ocupación tanto para la población ocupada como desocupada, relevando para este último grupo el dato de la última ocupación realizada, en el caso que hubiera existido. Mientras que el primer dato se guarda en la variable PP04D_COD, la última ocupación de los desocupados puede encontrarse en la variable PP11D_COD. Con el comando table podemos visualizar todos los códigos existentes en la base y su frecuencia absoluta.

table(eph_ind_215$PP04D_COD)

      00001 01001 02001 03001 04001 05001 05002 06001 06002 07001 10112 10113 
35630    44     2    11    66    11   102   654   266     1     6    26    13 
10122 10131 10132 10133 10201 10202 10203 10311 10312 10313 10314 10323 10331 
    1     2    12     8    12    53    60    11   136   118    31     2    29 
10332 10333 11113 11131 11132 11202 11203 11311 11312 11313 11323 11331 11332 
   33  2127     1   108     2     2     3    10     4     6     1   112     4 
11333 20111 20112 20113 20131 20132 20133 20202 20203 20311 20312 20313 20314 
   52     1     1     9    57     2     7    10    25     8     7   203     6 
20323 20331 20332 20333 30111 30112 30113 30131 30132 30133 30202 30203 30311 
    1    94    67   354     2    74   930     3     1     9     1    71     8 
30312 30313 30314 30323 30331 30332 30333 31113 31312 31313 31314 32111 32113 
  217   310  1018     1     4     2    23    58     2   148     3     1     1 
32123 32131 32133 32201 32202 32311 32312 32313 32314 32323 32333 33113 33133 
    1     2     1     1     5     1     2     5   152     2    10   217     1 
33312 33313 33314 33333 34113 34123 34202 34203 34312 34313 34314 34323 34324 
    2     8    20     3     3   241     6     9     5    15    30   939     4 
34331 34332 34333 35113 35123 35131 35201 35202 35203 35313 35314 35323 35333 
    1     2     1     4    20     2     2     1     6    11    28   176     7 
36113 36203 36313 36314 36323 36333 40111 40112 40113 40131 40132 40201 40202 
   13    16    57   104    59    70    77    57     2     5     2     4    17 
40203 40311 40312 40313 40314 40322 40323 40331 40332 40333 41111 41112 41113 
    1   251   400    12    19    27     9    23    12     1     2   112     1 
41201 41202 41203 41311 41312 41313 41314 41323 41331 41332 41333 42131 42201 
    5    10    14   115  1335    98     1     2    12     1     2     1     1 
42202 42203 42311 42313 42331 42332 42333 43111 43112 43131 43311 43331 43332 
    1     4     4     7    39     5     6     1     2    22     1    40     4 
44111 44112 44113 44131 44132 44203 44312 44313 44331 45111 45112 45122 45123 
    1     3     2     2     1     3    41    10     2     1     3     3     1 
45131 45132 45203 45311 45312 45322 45323 45331 45332 45662 46112 46202 46203 
    5     3     1    11    34     8     2     7    30     1     3     3     1 
46311 46312 46313 46314 46331 46332 46333 47113 47203 47312 47313 47314 47323 
   18    52    17     2     3     1     2     5     7     1   255    71     6 
48203 48311 48312 48313 48323 49202 49203 49311 49312 49313 49314 49323 49331 
    5    27    65   309    14     1     1     3    14    53     4     5     1 
50111 50112 50113 50122 50131 50311 50312 50313 50322 51112 51202 51203 51312 
   22     1     2     1     2    25     2     2     1    30     2     1    77 
51314 51331 52112 52113 52123 52203 52312 52313 52314 52323 52332 52333 53112 
    3     1     3     2     4     3    13    20     2     5     4     3     2 
53113 53203 53312 53313 53314 53323 54112 54133 54311 54312 54313 54323 54332 
  160    31     9   262   286     3     4     1     1    10    14     1     2 
54333 55203 55312 55314 56113 56123 56203 56313 56314 56323 57112 57113 57312 
   12     3     1  1354    22     1     7    67   927    21     9   130     3 
57313 57314 58112 58113 58132 58203 58312 58313 58314 58323 58332 59313 60111 
   30   437    11   128     1     1     8   108    13     2     2     1     2 
60113 60123 60131 60203 60311 60312 60313 60314 60323 60331 60332 60333 61113 
    1     4     6     2     1     1    50     3    11     5     1     1     4 
61123 61203 61311 61313 61314 61323 61331 62313 62314 62323 63113 63313 63331 
    2     1     1    10     2     1     1     5     1     4     1     2     2 
64113 64202 64313 64314 64323 64331 70131 70202 70203 70311 70312 70313 70322 
    1     1     8     2     2     1     2     3    28     1     3    33     2 
70323 70331 70332 70333 71113 71201 71202 71203 71311 71312 71313 71323 71331 
   27     8     2     1     1     2     1    10     1     3     9    12     6 
71332 71333 72112 72113 72131 72132 72201 72202 72203 72311 72312 72313 72314 
    1     1    29   873    50     1     2     3    58     2    60  1068   576 
72323 72331 72332 72333 73113 74314 80111 80112 80113 80123 80131 80132 80202 
   41    56    17     2     1     1     1    74   144   222     5     1     4 
80203 80311 80312 80313 80314 80322 80323 80331 80332 80333 81101 81121 81123 
   64     4    24   516    63     4   688    21     2    10     1     1     2 
81131 81132 81201 81202 81323 81331 81332 81333 82111 82112 82113 82123 82131 
   23     3    19     1     1    68     9     1     1    46   219    49     1 
82203 82312 82313 82314 82323 90112 90113 90203 90312 90313 90323 90331 90332 
    2    23   192    32     7     4     5     6    14    76     6     1     2 
91311 92112 92113 92132 92202 92203 92312 92313 92331 92333 99999 
    1    44     3     2     1     1    90    48     2     1    53 

Por otro lado, el paquete eph mediante la función organize_CNO nos agrega 4 columnas a la base en donde se clasifica cada componente del CNO: carácter, jerarquía, tecnología y calificación ocupacional. A continuación revisamos dicho comando y solicitaremos las frecuencias, por ejemplo, de la calificación.

eph_ind_215 <- organize_cno(base = eph_ind_215)

table(eph_ind_215$CALIFICACION)

No calificados          Ns.Nc     Operativos  Profesionales       Técnicos 
          5195             53          12879           2012           4259 

Por su parte en la variable PP04D_CIUO encontraremos a la ocupación codificada según el CIUO.

table(eph_ind_215$PP04D_CIUO)

0110 0210 0310 1111 1112 1114 1120 1211 1212 1213 1219 1221 1222 1223 1311 1321 
   4   10   34    4   45    7   34    5    4    1    6   45    1    1    7    5 
1322 1323 1324 1330 1341 1342 1343 1344 1345 1346 1349 1411 1412 1420 1431 1439 
   1   14   12    5    1    8    2    1   76   15    6    5   24   68    1   14 
2111 2112 2113 2114 2120 2131 2132 2133 2141 2142 2143 2144 2145 2146 2149 2151 
   1    3    1    6    1   38   20    5   17   33    4    4    6    2    3    8 
2152 2153 2161 2163 2164 2165 2166 2211 2212 2221 2240 2250 2261 2262 2263 2265 
   5    2   80    9    1   10   21  121  110    3    2   19   58   30    6    3 
2266 2269 2310 2320 2330 2341 2342 2351 2352 2353 2354 2355 2356 2359 2411 2412 
   5    9  164   39  426  487  177   20   50   24   27   34    4   83  189   14 
2413 2421 2422 2423 2424 2431 2432 2433 2434 2511 2512 2513 2514 2519 2521 2522 
   2    5   19   51   11    8    3    7    1   33   20   22    9    2    4    8 
2523 2529 2611 2612 2619 2622 2631 2632 2633 2634 2635 2636 2641 2642 2643 2651 
   9    2  242   10    1    3   11    2    1   86   26   12    3   54    5    5 
2652 2653 2654 2655 2656 2659 3111 3112 3113 3114 3115 3116 3117 3118 3119 3121 
  21    2    6    8   17    3   13   29   12   25    6    3    7    8    4   23 
3122 3123 3131 3132 3133 3134 3135 3139 3141 3142 3143 3152 3153 3154 3155 3211 
  71   92   21   14    3   14    1   18    6    2    1    4    2    3    3   40 
3212 3213 3214 3221 3222 3240 3251 3252 3253 3254 3255 3256 3257 3258 3259 3311 
  37   10   16  257    2    2    6    4    3    6   52   11   54    3    1   15 
3312 3313 3314 3315 3321 3322 3323 3324 3331 3332 3333 3334 3339 3341 3342 3343 
  34   77    8    6   47   72   14   66    9   17    5   40   47  109   32   91 
3344 3351 3352 3353 3354 3355 3359 3411 3412 3413 3421 3422 3423 3431 3432 3434 
  27    1    9    3   10    9    9   36   55    5    7   34  104   23   11   17 
3435 3511 3512 3513 3514 3521 3522 4110 4120 4131 4132 4211 4212 4214 4221 4222 
  33   23   13   19    9   30    8 1830  226    5   24   21   59   29   27   81 
4223 4224 4225 4226 4227 4229 4311 4312 4313 4321 4322 4323 4411 4412 4413 4415 
  38   25   29   64    9    4  289    9   18  119   17   35   26   70    1    3 
4416 4419 5111 5112 5113 5120 5131 5132 5141 5142 5151 5152 5153 5161 5162 5163 
   6   20    1    3   15  301  146   36  155   42    7    4   52    2    5    6 
5164 5165 5169 5211 5212 5221 5222 5223 5230 5241 5242 5243 5244 5245 5246 5249 
  23    1    6   69   33 1122   93 1229  230    2    7  241   41   47   36    8 
5311 5312 5321 5322 5329 5411 5412 5413 5414 5419 6111 6112 6113 6114 6121 6122 
 265  106   62  147   57   10  413   42  344   42    9    6   10   11   27    3 
6123 6130 6210 6222 6223 7111 7112 7113 7114 7115 7119 7121 7122 7123 7125 7126 
   2    5    6    5    6    5 1240    3    4   58    3   10    8   11   11  163 
7127 7131 7132 7211 7212 7213 7214 7215 7221 7222 7223 7224 7231 7232 7233 7234 
  39  177   31    2  126   74   17    2  108   23   34    3  318   14  141   14 
7311 7312 7313 7314 7315 7316 7317 7318 7319 7321 7322 7323 7411 7412 7413 7421 
   3    3    4   10    5    9   22   63   25   19   52   13  185   73   44   28 
7422 7511 7512 7513 7514 7515 7516 7521 7522 7523 7531 7532 7533 7534 7535 7536 
 111   54  115    7    1    9    1    4   74    3   73   10   63   27    1   40 
7542 7543 7544 7549 8111 8112 8113 8114 8121 8122 8131 8132 8141 8142 8143 8151 
   2   34    9    9    3    3   37   12   44   14   17    2   28   35   13   21 
8152 8153 8154 8155 8156 8157 8159 8160 8172 8181 8182 8183 8189 8211 8212 8219 
  12   73    5    2   18   23   24  102   30   19    2   53    5   28   88   18 
8311 8312 8321 8322 8331 8332 8341 8342 8343 8344 8350 9111 9112 9121 9122 9123 
  10    9   49  758  179  242   18   25   24   58    6 1361  763   11   75    1 
9129 9211 9212 9213 9214 9215 9311 9312 9313 9321 9329 9331 9333 9334 9411 9412 
   2   28   14    1  190    3    6   13  561   61   47    5  158  146   36  138 
9510 9520 9611 9612 9613 9621 9622 9623 9624 9629 9999 
   8  113   45   41  108   32  123    7    1   21   41 

A través del paquete modest y el comando mfv (most frequent value) calcularemos la moda de dichas variables, es decir, la ocupación más repetida en el relevamiento.

modeest::mfv(eph_ind_215$PP04D_CIUO, na.rm = TRUE)
[1] 4110
411 Levels: 0110 0210 0310 1111 1112 1114 1120 1211 1212 1213 1219 1221 ... 9999

El código 4110 designa a los oficinistas generales

4.3.3 Rama de actividad

Al igual que para el caso de la ocupación, la rama de actividad es computada tanto para la población ocupada como la desocupada. En los relevamientos previos a 2011 y posteriores a 2016, en el primer caso acudimos a la variable PP04B_COD mientras que en el segundo a la PP11B_COD. Para los relevamiento entre 2011 y 2015, dichas variables fueron nombradas sin el sufijo *_COD* y con el sufijo *_CAES*.

Echamos un vistazo a la distribución de la población ocupada según la rama de actividad.

table(eph_ind_215$PP04B_CAES)

       0101  0102  0103  0104  0200  0300  0600  0700  0800  0900  1001  1002 
35630   101    43    35     1     6    15    48     4    26   100   116    43 
 1003  1009  1100  1200  1300  1400  1501  1502  1600  1700  1800    19  1902 
   37   383    53     5   120   156    13    57    41    31    67     3     8 
   20  2001  2002  2009  2100  2201  2202  2301  2309  2400  2500  2601  2602 
   24     6    30     5   101    33    62    14    63    26   406    18     7 
 2603  2604  2701  2709  2800  2900  3001  3003  3009  3100  3200  3300  3501 
   24    26    34    32    94    68     8     2    22   179   110   104   101 
 3502  3600  3800  3900  4000  4501  4502  4503  4504    48  4801  4802  4803 
   19    53   113     3  2575   100   398    74    48   126    21    35   777 
 4804  4805  4806  4807  4808  4809  4810  4811    49  4901  4902  4903  4904 
  427   168    80   651   827    41   416    28    15    36     1   582   302 
 4909  5000  5100  5201  5202  5300  5500  5601  5602  5800  5900  6000  6100 
   36    14    15    34   168   114   102   669    42    37    23    54   158 
 6200  6300  6400  6500  6600  6800  6900  7000  7100  7200  7301  7302  7400 
   95     7   219   179    12    55   371    60   136    36    40    11    91 
 7500  7701  7702  7800  7900  8000  8101  8102  8200  8401  8402  8403  8501 
   29    16     9    12    44   220   143   131   115  2094   990    76  1944 
 8509  8600  8700  8800  9000  9100  9200  9301  9302  9401  9402  9409  9501 
  229  1243    65    24    29    26   105   169    61    26    34   321    49 
 9502  9503  9601  9602  9603  9609  9700     Z 
    9   168    18   214    25    62  1780   113 

Del mismo modo que con la ocupación, el paquete eph mediante la función organize_CAES nos agrega 8 columnas a la base en donde se clasifican distintas cuestiones: versión de la CAES, código de sección y división, etiqueta de sección y división y clasificación de ramas de actividad agregadas. A continuación revisamos dicho comando y solicitaremos las frecuencias de las ramas agregadas.

eph_ind_215$PP04B_COD <- as.character(eph_ind_215$PP04B_COD)  #esta linea de comando corrige un error derivado del auto-etiquetamiento de las categorías.
eph_ind_215 <- organize_caes(base = eph_ind_215)

table(eph_ind_215$caes_eph_label)

                              Actividades primarias 
                                                379 
                            Industria manufacturera 
                                               2631 
                                       Construccion 
                                               2575 
                                           Comercio 
                                               4217 
                             Hoteles y restaurantes 
                                                813 
        Transporte, almacenamiento y comunicaciones 
                                               1691 
 Servicios financieros, de alquiler y empresariales 
                                               1929 
 Administracion publica, defensa y seguridad social 
                                               3084 
                                          Ensenanza 
                                               2173 
                      Servicios sociales y de salud 
                                               1332 
                                 Servicio domestico 
                                               1780 
Otros servicios comunitarios, sociales y personales 
                                               1316 
                                        Otras ramas 
                                                169 
                  Actividades no bien especificadas 
                                                120 

4.3.4 Categoría de ocupación

La categoría de ocupación es una variable que también es de vital importancia en la construcción de clasificaciones. La misma puede encontrarse bajo el nombre de CAT_OCUP. A continuación exploramos sus categorías:

table(eph_ind_215$CAT_OCUP)

                                   0                               Patron 
                               34530                                  969 
                       Cuenta propia                    Obrero o empleado 
                                4772                                19597 
Trabajador familiar sin remuneracion 
                                 160 

4.3.5 Sector de actividad

En la EPH el sector de actividad puede encontrarse en la variable PP04A.

table(eph_ind_215$PP04A)

              0      ...estatal      ...privada ...de otro tipo        Ns./Nr.. 
          35630            5517           18492             373              16 

4.3.6 Tamaño del establecimiento

La medición del tamaño del establecimiento se encuentra distribuida en dos variables: PP04C y PP04C99. La primera permite captar en forma detallada el tamaño del establecimiento donde trabaja la persona en diferentes rangos, mientras que la segunda permite recuperar, mediante una clasificación más acotada, aquel dato que en la primera variable figuraba como “Ns/Nc”. A continuación exploramos ambas variables en forma cruzada.

table(eph_ind_215$PP04C, eph_ind_215$PP04C99)
                       
                            0 hasta 5 de 6 a 40 mas de 40 Ns./Nr..
  0                     37370       0         0         0        0
  1 persona              3565       0         0         0        0
  2 personas             2123       0         0         0        0
  3 personas             1241       0         0         0        0
  4 personas              816       0         0         0        0
  5 personas              752       0         0         0        0
  6 a 10 personas        1876       0         0         0        0
  11 a 25 personas       1783       0         0         0        0
  26 a 40 personas       1567       0         0         0        0
  de 41 a 100 personas   2035       0         0         0        0
  de 101 a 200 personas  1386       0         0         0        0
  de 201 a 500 personas  1204       0         0         0        0
  mas de 500 personas    1304       0         0         0        0
  Ns./Nr.                   0     125       610       919     1352

Al igual que en el caso de la ocupación y la rama de actividad, para aquellas personas desocupadas que han trabajado alguna vez en el pasado, el tamaño del establecimiento puede ser identificado en las variables PP11C y PP11C99.

4.3.7 Supervisión

Si bien la supervisión no es una variable medida directamente en la EPH, podemos aproximarnos a dicha noción a través del CNO. En su tercer dígito mide la jerarquía ocupacional. Sin embargo, para extraer dicha información es necesario “partir” el código ocupacional, reteniendo el tercer dígito. A través de R, realizaremos la operación utilizando la función str_sub del paquete stringr, indicando que dígitos queremos retener. En este caso debemos señalar que queremos retener únicamente el tercer dígito (que empiece en el 3 y termine en el 3) y se lo asignaremos a una nueva variable llamada “cno_jerarquia”.

eph_ind_215$cno_jerarquia <- str_sub(eph_ind_215$PP04D_COD, start = 3, end = 3)

eph_ind_215 %>%
    filter(cno_jerarquia == 2) %>%
    nrow()
[1] 619

Conociendo que el código 2 es el que hace referencia a la jefatura, si filtramos los resultados podemos decir que existen 619 casos que supervisan las tareas de otras personas.