Donnée

De Wiki ODR
Aller à : navigation, rechercher

voir aussi données MSA, secret statistique, référencement dans le dictionnaire, Modèle conceptuel données cnasea

Une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction, d'un événement, etc.

Une donnée statistique est la valeur d'un attribut (ou variable) pour une entitié statistique.

Dans l'observatoire, sont gérées plusieurs classes d'entités : d'une part des entités géographiques (toutes reliées à un index unique des communes de France, référentiel INSEE, 1999), d'autre part des classes d'entités non géographiques mais localisées.

Les indicateurs (données produites par l'application carto) sont des variables géographiques ou géocodées. Les indicateurs décrivent, expriment des propriétés de telle ou telle classe d'entités géographiques. Un indicateur est généralement défini à différents niveaux géographiques, le niveau le plus fin étant défini par le niveau géographique des variables entrant dans la formule de l'indicateur (ex: commune), le niveau d'aggrégation le plus élevé étant défini par l'étendue des bases utilisées (ex: France métropolitaine.

Catégories de données dans l'observatoire, selon la convention CNASEA/INRA/MAP

Les définitions ci-dessous sont reprises de l'article 2 de la convention créant l'observatoire.

Données primaires : données brutes, publiques ou administratives, fournies par les partenaires fondateurs et/ou les tiers agréés. Ces données sont anonymes et accessibles aux utilisateurs, sous la responsabilité du comité de pilotage (s'il ne s'agit pas de données publiques). Les données primaires sont donc les données initiales (quelque soit leur statut ou leur provenance) qui sont reférencées dans l'observatoire. Il peut s'agir soit de données dites individuelles, caractérisant par exemple des bénéficiaires de mesures publiques, les contrats signés, des exploitations agricoles ou des entreprises, soit de données agrégées à un niveau géographique donné, par exemple le nombre de chef d'exploitation féminins par commune. Les données individuelles déposées dans l'observatoire sont anonyme.

Données secondaires : données primaires travaillées par les partenaires fondateurs et/ou par les tiers agrées afin d’obtenir des indicateurs statistiques permettant l’évaluation des politiques publiques en matière de développement rural ou le développement de recherches. Les données secondaires deviennent des données de l’observatoire, elles peuvent circuler entre utilisateurs. Elles sont notamment destinées à être mises à disposition d’évaluateurs (désignés par le MAP ou par le CNASEA), d’équipes de recherche INRA ou de tiers agréés.

Les données primaires et secondaires font l'objet d'une déclaration à la CNIL, lorsqu'il s'agit de données individuelles. Les données agrégées sur le plan géographiques sont pour certaines d'entre elles sensibles au secret statistique.

Données publiques : données (primaires ou secondaires) potentiellement disponibles pour tout utilisateur de l’observatoire. Ces données (primaires) proviennent de sources publiques où elles sont disponibles pour tous publics (sites publics et publications de l’INSEE ou du SCEES ou des Ministères…). Elles peuvent aussi être produites dans le cadre de l’observatoire (données secondaires) à partir de données publiques ou de données réservées traitées à un niveau d’agrégation où elles deviennent publiques (cas, par exemple, des nombres de bénéficiaires de mesures du RDR agrégés au niveau des départements).

La notion de « données publiques », comme données produites (collectées et/ou traitées et/ou diffusées) dans le cadre de l’activité du service public est définie par la Circulaire du 14 février 1994 relative à la diffusion des données publiques, J.O. 19 février 1994).

Données réservées : données (primaires ou secondaires) localisées (individuelles ou agrégées sur des territoires) posant un problème de secret statistique. Elles ne sont disponibles que dans le cadre de projets spécifiques et mises à disposition par un fournisseur de données.

Types de données gérées par l'application carto (serveur de l'observatoire)

voir référencement dans le dictionnaire

Un utilisateur ayant importé une table de données (dans une zone de dépôt) doit les référencer dans le dictionnaire général de l'application, afin que ces données soit utilisables dans des traitements par lui ou par d'autres si cet utilisateur prévoit cette possibilité.

Lors du référencement dans le dictionnaire les variables enregistrées sont caractériser par un ensemble d'attributs qui fixent leur statut ou, en d'autres termes, définissent les conditions d'utilisation de ces variables.

       Les 4 "p"
Les variables utilisées peuvent être déclarées :
 * PERSONNELLES et NON PUBLIABLES : 
    aucune information ne sera disponible sur ces variables
 * PERSONNELLES et PUBLIABLES : ces variables sont mentionnées dans 
    la partie publique du dictionnaire, 
    mais l'accès est strictement réservé à celui qui a déposé ces données.
 * PRIVEES et NON PUBLIABLES : l'acces à ces variables est possible 
    pour les autres utilisateurs, membres du projet où elles ont été référencées, 
    mais l'information n'est pas diffusée
 * PRIVEES et PUBLIABLES : l'acces à ces variables est possible pour 
    les autres utilisateurs, membres du projet où elles ont été référencées 
    et l'information figure dans le dictionnaire public.
 * PUBLIQUES : ces variables deviennent accessibles à tout utilisateur 
    dans tous les projets créés dans l'application.