L’équipe d’ingénieurs spécialisés en terminologie scientifique de l’Institut travaille régulièrement sur des thésaurus liés à l’actualité. Après le thésaurus créé à l’occasion des 150 ans du tableau de Mendeleïev en 2019, le thésaurus COVID-19 en 2020 et le thésaurus sur la science ouverte en 2021, c’est au tour du paléoclimat d’avoir fait l’objet d’une étude terminologique.
Un besoin scientifique
L’idée de ce thésaurus est née en 2019 après une réflexion avec des chercheurs du domaine, avec l’objectif d’offrir à la communauté scientifique un vocabulaire de référence. En effet, inexistant jusqu’alors, il facilite le partage des connaissances, des données et des productions scientifiques en paléoclimatologie qui, rappelons-le, est l’étude des climats passés et de leurs variations au fil du temps.
De la constitution d’un corpus à la publication du thésaurus
Pour sa création, la première étape a consisté en l’élaboration d’un corpus de références bibliographiques et d’articles issus des bases de données WOS, Scopus et de la plateforme Istex.
Au total, le corpus comptait près de 40 000 documents, couvrant la période 1890-2020.
Une extraction terminologique a ensuite été effectuée avec l’outil TermSuite. Après une première sélection parmi plus de 140 000 termes, une liste de 7000 termes a été établie sur laquelle sept chercheurs en paléoclimatologie ont travaillé.
Ils ont procédé à l’examen et au choix de termes préférentiels avec correction et validation des concepts créant ainsi un thésaurus de 2000 entrées conceptuelles hiérarchisées sous une trentaine de top-concepts.
Le thésaurus a été enrichi avec des définitions avant l’étape finale de structuration et de publication sur la plateforme Loterre.
Tous les concepts sélectionnés ont été traduits en français et ils ont été alignés avec les systèmes internationaux d’organisation des connaissances, notamment Wikipédia. À ce jour, 600 de ces concepts ont été enrichis avec des définitions.
Des perspectives
Plusieurs perspectives d’utilisation ont été définies pour ce thésaurus :
- Partage des connaissances, en fournissant une ressource accessible, consultable et téléchargeable librement en ligne : https://skosmos.loterre.fr/QX8 ;
- Contribution à une uniformisation des termes utilisés et régler les problèmes de polysémie et d’homonymie;
- Référentiel pour indexer les jeux de données de la recherche déposés dans des entrepôts ;
- Outil d’enseignement, pour mieux explorer et partager les connaissances, notamment dans le cadre du web sémantique.
Un poster
Afin de présenter le travail mis en œuvre dans ce projet, un poster a été réalisé et présenté à l’occasion de la 7e édition des journées « Climat et Impacts » qui s’est tenue du 23 au 25 novembre 2022 à l’université Paris-Saclay.
Poster : Un nouveau thésaurus de paléoclimatologie : création et perspectives d’utilisation
Voir le poster dans HAL : https://hal.archives-ouvertes.fr/hal-03895146v1
Accéder au thésaurus de paléoclimatologie…