Donnée

De Wiki ODR
Aller à : navigation, rechercher

Introduction

Une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction, d'un événement, etc.

Une donnée statistique est la valeur d'un attribut (ou variable) pour une entité statistique. En particulier une donnée géo-localisée est un attribut d'un géocode, qui est une entité statistique géographique.

Sur la plateforme ODR, l'interface de traitement (accessible aux utilisateurs titulaires) gère plusieurs classes d'entités : d'une part des entités géographiques (toutes reliées à un index unique des communes de France, référentiel INSEE, 1999), d'autre part des classes d'entités non géographiques ou "individus" (de différentes natures). Une donnée dans l'ODR est donc en rapport avec un géocode (donnée géocodée stricte) et une classe d'individus (table avec géocodes multiples, plusieurs lignes avec le même géocode distinguées par une clé individuelle).

Les indicateurs (données produites par l'application carto) sont des variables géocodées, des attributs pour un territoire. Les indicateurs décrivent, expriment des propriétés de telle ou telle classe d'entités géographiques. Ils répondent à une question concernant l'état socio-économique ou environnemental d'un territoire, les pressions diverses sur son économie ou les impacts de l'action publique. Un indicateur est généralement défini à différents niveaux géographiques, le niveau le plus fin étant défini par le niveau géographique des variables entrant dans la formule de l'indicateur (ex: commune), le niveau d'agrégation le plus élevé étant défini par l'étendue des bases utilisées (ex: France métropolitaine).

Catégories de données dans l'observatoire ODR, selon leur origine

Les données déposées sur la plateforme ODR, par des utilisateurs titulaires, ont plusieurs origine:

Données personnelles, déposées par un utilisateur pour ses propres traitements et provenant de ces propres enquêtes ou sources. L'existence de ces données, éventuellement partagées dans le cadre d'un projet, n'est pas nécessairement connue des autres utilisateurs de l'ODR. Si ces données figurent dans le répertoire des données (voir la règle des 4 P, ci-après), l'accès à ces données doit directement être demandé à leur propriétaire (celui qui les a déposées).


Données déposées par les partenaires institutionnels de l'ODR (ASP, MSA, INAO). Ces données peuvent être mises à disposition De chercheurs (dans le cadre de projets créés par des utilisateurs titulaires) sous réserve d'un accord des partenaires concernés (voir ci-dessous). Une demande d'accès aux données peut être faire via le formulaire figurant dans le menu de l'ODR. NB: les utilisateurs peuvent traiter les données sur la plateforme, mais non exporter les données individuelles. Seules sont exportables des cartes et des tables d'indicateurs agrégés avec un niveau autorisé d'agrégation pour l'exportation.

Données publiques (statistiques ou administratives) attribuées via le "Comité du secret" à un chercheur ou groupe de chercheurs. Les chercheurs autorisés peuvent déposer ces données sur l'ODR et les partager (privativement). Il est préférable de ne pas déclarer ces données dans le répertoire.

Cas des données détenues par l'US-ODR. L'US-ODR qui est l'unité de services qui gère la plateforme ODR est aussi une unité de recherche disposant de sources de données particulières, notamment obtenues via le Comité du secret statistique (RGA 1988, RA 2000 ou données ASP premier pilier, références laitières, etc. L'information sur ces données ne figure pas nécessairement dans le répertoire des données, toutefois des indicateurs construits à partir de ces données peuvent être présentés sur l'ODR avec un niveau d'agrégation respectant le secret statistique (voir le programme "visite de l'observatoire"). Toutefois lorsqu'il s'agit d'enquêtes publiques on peut trouver un accès à ces bases de données sur le site de la statistique publique [1] .

Données d'accès public.

Catégories de données dans l'observatoire, selon les définitions de la convention CNASEA/INRA/MAP

Les définitions ci-dessous sont reprises de l'article 2 de la convention créant "l'observatoire des programmes communautaires de développement rural", dont les partenaires sont l'INRA, le Ministère de l'agriculture et le CNASEA (devenu ASP). Le fournisseur des données est l'ASP (anciennement CNASEA). Il s'agit de "données publiques" (au sens légal: description de l'activité publique), dont la diffusion est placée sous le contrôle du Ministère de l'agriculture.

Données primaires : données brutes, publiques ou administratives, fournies par les partenaires fondateurs et/ou les tiers agréés. Ces données sont anonymes (si "individuelles") et accessibles aux utilisateurs, sous la responsabilité du comité de pilotage. Les données primaires sont donc les données initiales (quel que soit leur statut ou leur provenance) qui sont référencées dans l'observatoire. Il peut s'agir soit de données dites individuelles, caractérisant par exemple des bénéficiaires de mesures publiques, les contrats signés, des exploitations agricoles ou des entreprises, soit de données agrégées à un niveau géographique donné, par exemple le nombre de chefs d'exploitation féminins par commune. Les données individuelles déposées dans l'observatoire sont anonymes.

Données secondaires : données primaires travaillées par les partenaires fondateurs et/ou par les tiers agréés afin d’obtenir des indicateurs statistiques permettant l’évaluation des politiques publiques en matière de développement rural ou le développement de recherches. Les données secondaires deviennent des données de l’observatoire, elles peuvent circuler entre utilisateurs. Elles sont notamment destinées à être mises à disposition d’évaluateurs (désignés par le MAP ou par le CNASEA), d’équipes de recherche INRA ou de tiers agréés.

Les données primaires et secondaires font l'objet d'une déclaration à la CNIL, lorsqu'il s'agit de données individuelles. Les données agrégées sur le plan géographique sont, pour certaines d'entre elles, sensibles au secret statistique.

Données publiques (au sens de l'observatoire ODR) : données (primaires ou secondaires) potentiellement disponibles pour tout utilisateur de l’observatoire. Ces données (primaires) proviennent de sources publiques où elles sont disponibles pour tous publics (sites publics et publications de l’INSEE ou du SCEES ou des Ministères…). Elles peuvent aussi être produites dans le cadre de l’observatoire (données secondaires) à partir de données publiques ou de données réservées traitées à un niveau d’agrégation où elles deviennent publiques (cas, par exemple, des nombres de bénéficiaires de mesures du RDR agrégés au niveau des départements).

Par ailleurs, la notion de « données publiques », comme données produites (collectées et/ou traitées et/ou diffusées) dans le cadre de l’activité du service public est définie par la Circulaire du 14 février 1994 relative à la diffusion des données publiques, J.O. 19 février 1994). Selon cette circulaire, par "publique", il faut entendre "une donnée collectée ou produite, dans le cadre de sa mission, par un service public, sur fonds publics" (et qui n'est pas de nature confidentielle). La "diffusion des données publiques", doit s'entendre, au sens large, comme la communication au public de données publiques, quel qu'en soit le support résultant de l'activité d'une personne publique (administration, service, organisme ou établissement public).

Données réservées : données (primaires ou secondaires) localisées (individuelles ou agrégées sur des territoires) posant un problème de secret statistique. Elles ne sont disponibles que dans le cadre de projets spécifiques et mises à disposition par un fournisseur de données.

Donnees.jpg

Types de données gérées par l'application carto (serveur de l'observatoire)

Voir référencement dans le dictionnaire

Un utilisateur titulaire peut importer une table de données, dans une zone de dépôt de l'observatoire liée au compte de l'utilisateur. Pour les utiliser (ou permettre à d'autres l'utilisation de ces données), il doit les référencer dans un ou plusieurs projets, à moins que ces données soient déclarées publiques auquel cas elles seront accessibles à tout projet.

Lors de l'importation, les variables retenues sont enregistrées en précisant certains attributs (voir Métadonnées) et leur statut ou, en d'autres termes, les conditions d'utilisation de ces variables, elles sont soit "réservées" soit "publiques". NB : Les attributs des variables peuvent être modifiés lors du référencement dans un projet.

Lors du référencement dans un projet, un deuxième élément du statut est précisé : les données sont soit "personnelles" soit "privées", c'est-à-dire en fait partagées (privativement) par les membres du projet.

       STATUT DES DONNEES DU POINT DE VUE DU SECRET ET DE LA DIFFUSION : Les 4 "p"
Les données enregistrées peuvent être déclarées :
 * PERSONNELLES et NON PUBLIABLES : 
    aucune information publique ne sera disponible sur ces variables 
    (elles ne sont pas recensées dans les répertoires du menu "accueil" de l'ODR)
    et ne sont utilisables que par le créateur de la table 
    ou le responsable du projet où elles sont référencées 
 * PERSONNELLES et PUBLIABLES : ces variables sont mentionnées dans 
    le répertoire, mais l'accès est réservé 
    à celui qui a déposé ces données (ou aux responsables des projets 
    où elles ont été référencées par leur propriétaire).
 * PRIVEES et NON PUBLIABLES : l'accès à ces variables est possible 
    pour les autres utilisateurs, membres du projet où elles ont été référencées, 
    mais l'information n'est pas diffusée
 * PRIVEES et PUBLIABLES : l'accès à ces variables est possible pour 
    les autres utilisateurs, membres du projet où elles ont été référencées 
    et l'information figure dans les répertoires du menu "accueil".
 * PUBLIQUES : ces variables deviennent accessibles à tout utilisateur 
    dans tous les projets créés dans l'application.

Autres articles en relation