Afin de mieux cerner les aspects quantitatifs du défigement, le recours au traitement informatique s’avère nécessaire. Dans cette contribution, nous nous intéressons tout d’abord aux techniques de linguistique de corpus qui peuvent être mises à profit pour le défigement. En particulier, nous montrons que le recours à de vastes corpus et à des requêtes complexes permet de mesurer en partie la proportion de défigement pour une séquence figée donnée. Les corpus ne livrent toutefois que des données partielles sur le défigement et ne permettent pas d’extraire automatiquement des séquences défigées. À cet effet, il est nécessaire de faire appel à l’intelligence artificielle et aux vastes modèles linguistiques pré-entraînés (LLMs). Dans une seconde expérience pratique, nous montrons comment l’usage d’un modèle LLM ouvre la voie à une reconnaissance et à une extraction automatique du défigement.
Colson, J.-P. (2025). Le traitement informatique du défigement : des corpus à l’intelligence artificielle. Français Moderne : revue de linguistique française, 2025(2), 1-15. https://hdl.handle.net/2078.5/246935 (Original work published 2025)