Identification des exploitations dans fichiers MSA

De Wiki ODR
Révision datée du 22 avril 2010 à 16:15 par Allaire (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Aller à : navigation, rechercher

Regroupement des exploitants MSA selon le numéro d’exploitation.

Au départ se trouvent les tables « brutes » COTNS pour les années 2002 jusqu’à 2008 (à la date d'avril 2010). L’objectif est de regrouper ces données par exploitation pour chaque année pour ainsi n’avoir qu’une ligne par exploitation, avec les variables correspondantes.

Afin de réaliser cette opération, il est également nécessaire de « créer » des numéros d’exploitation pour les entreprises n’en possédant pas dans les tables originales.


Etape 1 : On effectue une copie de la table de départ avec les variables qui seront employées (num_exp, code_insee, dept, sup, naf, af_maj, af_min, salaires, asb_aa, agr_tour, cris_ate, nais_an, reg_mal, acti_sec, rmiste, inst_an, type_exp, mat , voir liste des variables) à l’intérieur de laquelle on lance une « moulinette » qui, chaque fois qu’est trouvé un numéro d’exploitation vide, crée un identifiant de type R + unité de l’année concernée (ex : 5 pour 2005) + code insee de la commune + compteur automatique.

Dans ce même fichier, la variable cris_ate n’est pas renseignée partout. On va donc chercher à la définir selon la variable naf suivant le tableau ci-après :

Naf Cris_ate

011A 4

011G 5

012A 10

013Z 19

012C 11

011F 2

012J 14

011C 1

014B 24

012G 15

011D 1

014A 23

012E 12

144Z 20

On crée ensuite une table nommée coti_#année concernée# contenant les données ainsi modifiées.