Un partenariat qui dure
Ce travail de collaboration fait suite à un partenariat mis en place en 2011 avec le SAP2S (Service d’appui à la politique et à la prospective scientifiques) autour d’études bibliométriques. Le SAP2S, chargé de la production d’indicateurs et de la maîtrise d’ouvrage de plusieurs applicatifs du système d’information du CNRS, est un service de la Direction d’appui aux partenariats publics (DAPP) du CNRS.
Depuis cette date, l’Inist est sollicité chaque année par le SAP2S pour contribuer au repérage des unités de recherche CNRS à partir des adresses enregistrées dans le Web of Science (WoS). On parle de campagne annuelle de repérage d’adresses. Chaque campagne porte sur le repérage des adresses de l’année précédente.
Le rôle des agents de l’Inist : traiter les dictionnaires des laboratoires CNRS et les données du WoS et repérer automatiquement et manuellement les laboratoires CNRS dans les affiliations.
Méthodologie
Dans un premier temps, le SAP2S reçoit les données WoS sous forme XML et les transmet à l’Inist pour un reformatage en CSV et une extraction des affiliations. Puis un filtre France est appliqué sur ces adresses qui sont alors réparties en lots géographiques (33 lots). Les agents de l’Institut réalisent ensuite des traitements sur ces adresses dans le but de comparer les affiliations avec des dictionnaires (qui sont des listes d’expressions régulières pour chacun des labos CNRS) pour générer automatiquement des codes labos CNRS en fonction de l’année et du lot géographique, et indiquer si l’adresse est CNRS (Oui/Non).
Plusieurs cas surviennent lors de ces traitements :
– Les correspondances entre les affiliations et les codes labos sont sûres : les codes labos générés sont conservés et non révisés ;
– Les correspondances ne sont pas sûres (plusieurs labos possibles par exemple) ou aucun code labo n’a été généré : les labos doivent alors être répérés « manuellement », il s’agit alors de la campagne de repérage manuel réalisé par des agents du SAP2S et de l’Inist avec l’outil RepAdr, une application hébergée par l’Inist depuis 2013.
La campagne de repérage
Organisé en 2021 de juin à septembre, le repérage manuel des adresses 2020 a mobilisé, pour l’Inist, 12 agents dits « repéreurs » : 10 du service Appui au pilotage et 2 d’autres services. L’Inist a traité 22 lots géographiques. Les autres lots ont été traités par les « repéreurs » du SAP2S. Au total, plus de 600 heures de travail ont été comptabilisées pour les 12 agents de l’Institut ayant contribué au repérage des adresses.
Pour quoi ?
Véritable outil d’aide à la décision, les données issues de ce travail de repérage sont ensuite utilisées dans le rapport d’activité annuel du CNRS et aussi dans le rapport de données chiffrées et indicateurs diffusé chaque année via l’intranet.
Les résultats de ce travail de repérage sont également utilisés par l’Observatoire des sciences et techniques (département du Hcéres – Haut Conseil de l’évaluation de la recherche et de l’enseignement supérieur) pour la production des indicateurs de performance de la LOLF.
Par ailleurs, ces données servent dans le cadre d’études bibliométriques ainsi que de tableaux de bord réalisés pour les instituts du CNRS.
Le partenariat Inist – SAP2S : de la mise à jour des dictionnaires à la consolidation des résultats
Témoignage
Anne Sigogneau, SAP2S/DAPP/CNRS