Les entrepôts de données
Définition :
Un entrepôt de données (Data repository, digital repository) est un réservoir constitué majoritairement de données de recherche, brutes ou élaborées, qui sont décrites par des métadonnées de façon à pouvoir être retrouvées.
Données ouvertes de la recherche : nouvelles pratiques de publication et de partage. Cours Enssib (Aventurier P., 2013)
Type d'entrepôt de données
Thématique : GenBank (séquences d'ADN), UniProt (protéines) ;
Disciplinaire : PANGAEA (sciences de la terre et environnementales), Réseau Quetelet (sciences sociales) ;
Institutionnel : Edinburgh DataShare (Royaume-Uni), Open Data LMU (Allemagne), Merritt (Etats-Unis) ;
Spécifique d'un projet de recherche : Scientific Drilling Database (Programme continental de forage ICDP).
Entrepôt de confiance (trusted repository)
Un entrepôt de confiance se définit comme un entrepôt répondant aux critères de qualité exigés pour obtenir une certification (format des données, qualité des métadonnées, conditions d'accès et de réutilisation, identifiant pérenne, archivage à long terme, ...).
Dans ces entrepôts de données, il est attribué un identifiant ou un numéro d'accès à chaque jeu de données déposé.
Comment sélectionner un entrepôt de données de recherche ?
En consultant des annuaires d'entrepôts de données :
|
Attention :
Le programme cadre "Horizon 2020" exige, sauf restrictions juridiques et éthiques, que les données issues de projets relevant de l'initiative pilote sur le libre accès aux données soient déposées dans un entrepôt accessible.
Guidelines on Data Management in Horizon 2020 (Commission européenne, 2013)