L’objectif du projet était de décrire une infrastructure capable de rendre la fouille de texte accessible à tous, en offrant des services à même de contribuer à un effet catalyseur de la science : transfert de technologies, innovation, réutilisation des données et résultats.
Lancé en 2017 pour une durée de deux ans, le projet Visa TM du Comité pour la science ouverte est financé par le ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation. Il s’inscrit dans le mouvement de développement d’une science ouverte tendant à la mise à disposition des bibliothèques numériques et des ressources sémantiques et à l’intégration de données de sources diverses, dont textuelles.
Visa TM rassemble dans un partenariat trois institutions mettant en synergie leurs complémentarités : MaIAGE et DIST de l’INRA, l’Inist-CNRS et le LIRMM de l’université de Montpellier.
Une journée, organisée le 15 novembre 2019, a clôturé le projet. Elle a été l’occasion de dresser un état des lieux et de discuter des perspectives concrètes ouvertes par les résultats du projet.
Les présentations sont disponibles sur le site du projet, ainsi que les comptes rendus des quatre ateliers.
Livrables finaux du projet
Le projet a donné lieu à huit rapports, structurés autour de trois volets interdépendants :
- le volet Étude, dont les résultats sont présentés dans quatre rapports. Y sont exposés l’analyse des besoins de la communauté scientifique, l’identification des acteurs, la proposition d’un modèle d’organisation avec ses activités, ses missions et les métiers associés et un focus sur la fouille de textes, ses outils et la structuration de la recherche ;
- le volet Conception, basé sur la compréhension de l’architecture logicielle de la plateforme OpenMinTeD ((OpenMinTeD est une infrastructure européenne de TDM (Text and Data mining) à destination de publics divers : spécialistes du TDM, développeurs non spécialistes et intégrateurs, utilisateurs chercheurs). Un rapport décrit les briques logicielles principales d’OpenMinTeD, leur rôle, leur fonctionnement et leurs interactions. Le second détaille les développements réalisés sur la plateforme OpenMinTeD dans le cadre des appels d’offres lancés par ce projet ;
- le volet Application enrichit ces analyses par deux exemples concrets de développement d’application de fouille de texte, la conception de corpus en IST et l’extraction d’information pour la recherche. Un premier rapport porte sur l’application pilote pour l’IST et le second sur l’application pilote pour la recherche.
Pour plus d’informations : le site Visa TM et la page du groupe Visa TM du Comité pour la science ouverte.