L’équipe Istex publie aujourd’hui un nouveau corpus sur data.istex. Ce corpus « Machine Translation » retrace l’évolution des méthodes et outils de la traduction automatique.
Le corpus spécialisé fait partie de la collection Traduction de data.istex et contient plus de 7 000 documents annotés. Pour réaliser ces annotations, une terminologie bilingue français-anglais sur les méthodes et outils de traduction automatique a été créée. L’enrichissement du corpus par les occurrences de cette terminologie, regroupées en 4 approches fondamentales, permet de mettre en évidence l’évolution des méthodes de traduction automatique (voir détails et explications des différentes approches sur le site Istex).
Voir cette vue dans data.istex : https://traduction-machinetranslation.corpus.istex.fr/graph/SPMf
Les résultats de cette étude seront présentés par Mathilde Huguin et Sabine Barreaux lors de l’atelier ARTS, qui fait partie du colloque CORIA TALN RJCRI RECITAL 2023, mais découvrez dès à présent ce corpus et ses nombreux graphiques sur data.istex.
Lien vers le corpus : https://traduction-machinetranslation.corpus.istex.fr/
En savoir plus sur le site Istex : https://www.istex.fr/exploration-diachronique-de-la-traduction-automatique
Institut de l’information scientifique et technique – UAR76 (Inist-CNRS) (2023) : Corpus Machine Translation. Istex – data.istex.fr, https://traduction-machinetranslation.corpus.istex.fr/ark:/67375/3GC-H21JQPSV-N.