La conférence CORIA-TALN se tenait du 5 au 9 juin à Paris. Istex était à l’honneur dans diverses présentations montrant que les données d’Istex sont de plus en plus utilisées dans le TAL et le TDM.
L’atelier ARTS s’est déroulé le lundi 5 juin. Il accueillait l’enseignant-chercheur Mathieu Constant pour une conférence invitée intitulée « Construction d’un jeu de données de publications scientifiques pour le TAL et la fouille de textes à partir d’ISTEX. »
La session posters qui a suivi la conférence invitée regroupait 3 travaux impliquant des données Istex.
- Le corpus Istex sur la diachronie de la traduction automatique présenté par l’équipe Istex de l’Inist
- Des données Istex, mais aussi des données provenant de Loterre, seront utilisées dans le projet MaTOS Machine Translation for Open Science, présenté par F. Yvon (ISIR)
- Un corpus de 8 657 documents extrait d’Istex pour comprendre les relations, dans les articles scientifiques, portant sur le microbiome humain.
Plus de détails et liens vers les communications scientifiques sur le site Istex : https://www.istex.fr/conference-taln-2023-istex-pour-le-tal-et-le-tdm/
Vous avez besoin de données textuelles en quantité pour du TAL ou du TDM ? Rendez-vous sur l’API, sur l’outil Istex-DL ou contactez nous