Donnée
Voir aussi données MSA, secret statistique, référencement dans le dictionnaire, Modèle conceptuel données cnasea, indicateur, variable, données SCEES, Dublin Core, métadonnée.
Une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction, d'un événement, etc.
Une donnée statistique est la valeur d'un attribut (ou variable) pour une entité statistique. En particulier une donnée géo-localisée est un attribut d'une géocode, qui est une entité statistique géographique.
Dans l'observatoire, sont gérées plusieurs classes d'entités : d'une part des entités géographiques (toutes reliées à un index unique des communes de France, référentiel INSEE, 1999), d'autre part des classes d'entités non géographiques mais localisées.
Les indicateurs (données produites par l'application carto) sont des attributs pour un territoire, des variables géocodées. Les indicateurs décrivent, expriment des propriétés de telle ou telle classe d'entités géographiques. Ils répondent à une question concernant l'état socio-économique ou environnemental d'un territoire, les pressions diverses sur son économie ou les impacts de l'action publique. Un indicateur est généralement défini à différents niveaux géographiques, le niveau le plus fin étant défini par le niveau géographique des variables entrant dans la formule de l'indicateur (ex: commune), le niveau d'agrégation le plus élevé étant défini par l'étendue des bases utilisées (ex: France métropolitaine).
Catégories de données dans l'observatoire, selon la convention CNASEA/INRA/MAP
Les définitions ci-dessous sont reprises de l'article 2 de la convention créant "l'observatoire des programmes communautaires de développement rural". Le fournisseur des données est l'ASP (anciennement CNASEA). Il s'agit de "données publiques" (au sens légal: description de l'activité publique), dont la diffusion est placée sous le contrôle du Ministère de l'agriculture.
Données primaires : données brutes, publiques ou administratives, fournies par les partenaires fondateurs et/ou les tiers agréés. Ces données sont anonymes (si "individuelles") et accessibles aux utilisateurs, sous la responsabilité du comité de pilotage (s'il ne s'agit pas de données publiques). Les données primaires sont donc les données initiales (quel que soit leur statut ou leur provenance) qui sont référencées dans l'observatoire. Il peut s'agir soit de données dites individuelles, caractérisant par exemple des bénéficiaires de mesures publiques, les contrats signés, des exploitations agricoles ou des entreprises, soit de données agrégées à un niveau géographique donné, par exemple le nombre de chefs d'exploitation féminins par commune. Les données individuelles déposées dans l'observatoire sont anonymes.
Données secondaires : données primaires travaillées par les partenaires fondateurs et/ou par les tiers agréés afin d’obtenir des indicateurs statistiques permettant l’évaluation des politiques publiques en matière de développement rural ou le développement de recherches. Les données secondaires deviennent des données de l’observatoire, elles peuvent circuler entre utilisateurs. Elles sont notamment destinées à être mises à disposition d’évaluateurs (désignés par le MAP ou par le CNASEA), d’équipes de recherche INRA ou de tiers agréés.
Les données primaires et secondaires font l'objet d'une déclaration à la CNIL, lorsqu'il s'agit de données individuelles. Les données agrégées sur le plan géographique sont, pour certaines d'entre elles, sensibles au secret statistique.
Données publiques (au sens de l'observatoire ODR) : données (primaires ou secondaires) potentiellement disponibles pour tout utilisateur de l’observatoire. Ces données (primaires) proviennent de sources publiques où elles sont disponibles pour tous publics (sites publics et publications de l’INSEE ou du SCEES ou des Ministères…). Elles peuvent aussi être produites dans le cadre de l’observatoire (données secondaires) à partir de données publiques ou de données réservées traitées à un niveau d’agrégation où elles deviennent publiques (cas, par exemple, des nombres de bénéficiaires de mesures du RDR agrégés au niveau des départements).
Par ailleurs, la notion de « données publiques », comme données produites (collectées et/ou traitées et/ou diffusées) dans le cadre de l’activité du service public est définie par la Circulaire du 14 février 1994 relative à la diffusion des données publiques, J.O. 19 février 1994). Selon cette circulaire, par "publique", il faut entendre "une donnée collectée ou produite, dans le cadre de sa mission, par un service public, sur fonds publics" (et qui n'est pas de nature confidentielle). La "diffusion des données publiques", doit s'entendre, au sens large, comme la communication au public de données publiques, quel qu'en soit le support résultant de l'activité d'une personne publique (administration, service, organisme ou établissement public).
Données réservées : données (primaires ou secondaires) localisées (individuelles ou agrégées sur des territoires) posant un problème de secret statistique. Elles ne sont disponibles que dans le cadre de projets spécifiques et mises à disposition par un fournisseur de données.
Types de données gérées par l'application carto (serveur de l'observatoire)
Voir référencement dans le dictionnaire
Un utilisateur titulaire peut importer une table de données, dans une zone de dépôt de l'observatoire liée au compte de l'utilisateur. Pour les utiliser (ou permettre à d'autres l'utilisation de ces données), il doit les référencer dans un ou plusieurs projets, à moins que ces données soient déclarées publiques auquel cas elles seront accessibles à tout projet.
Lors de l'importation, les variables retenues sont enregistrées en précisant certains attributs (voir Métadonnées) et leur statut ou, en d'autres termes, les conditions d'utilisation de ces variables, elles sont soit "réservées" soit "publiques". NB : Les attributs des variables peuvent être modifiés lors du référencement dans un projet.
Lors du référencement dans un projet, un deuxième élément du statut est précisé : les données sont soit "personnelles" soit "privées", c'est-à-dire en fait partagées (privativement) par les membres du projet.
STATUT DES DONNEES DU POINT DE VUE DU SECRET ET DE LA DIFFUSION : Les 4 "p" Les données enregistrées peuvent être déclarées : * PERSONNELLES et NON PUBLIABLES : aucune information publique ne sera disponible sur ces variables (elles ne sont pas recensées dans les répertoires du menu "accueil" de l'ODR) et ne sont utilisables que par le créateur de la table ou le responsable du projet où elles sont référencées * PERSONNELLES et PUBLIABLES : ces variables sont mentionnées dans le répertoire, mais l'accès est réservé à celui qui a déposé ces données (ou aux responsables des projets où elles ont été référencées par leur propriétaire). * PRIVEES et NON PUBLIABLES : l'accès à ces variables est possible pour les autres utilisateurs, membres du projet où elles ont été référencées, mais l'information n'est pas diffusée * PRIVEES et PUBLIABLES : l'accès à ces variables est possible pour les autres utilisateurs, membres du projet où elles ont été référencées et l'information figure dans les répertoires du menu "accueil". * PUBLIQUES : ces variables deviennent accessibles à tout utilisateur dans tous les projets créés dans l'application.