(Enfin) une évolution des correcteurs orthographiques ?
S’il y a une invention qui est devenue tellement présente qu’elle s’est faite oublier, c’est bien le correcteur automatique.
Les correcteurs sont des programmes rudimentaires, conçus dans les années 1990 pour aider à l’utilisation du traitement de texte.
S’ils sont désormais omniprésents, ils n’ont en fait que très peu évolués depuis près de 30 ans.
Le principe général est toujours le même : comparer les mots écrits par l’utilisateur à une base de données, pour identifier les erreurs.
Dans un nouvel article, Microsoft présente le futur de la correction automatique, à travers un traitement du langage dopé à l’Intelligence Artificielle.
Baptisé Speller100, il s’agit d’un modèle de NLP (Natural Language Processing) entraîné sur 100 langues distinctes à reconnaître un ensemble de fautes pré-catégorisées.
Le principe est assez simple : le modèle découpe une phrase en séquences de mots, les encode dans un Transformer, puis les décode de manière à pouvoir réaliser une correction, d’abord tokenizée, puis mot à mot.
Pourquoi cette débauche de moyens ? La correction automatique étant utilisée tout le temps par tout le monde, on imagine sans peine le potentiel pour l’entraînement de futurs modèles de NLP derrière ce projet.
Post original : https://www.linkedin.com/posts/guillaumebesson_sil-y-a-une-invention-qui-est-devenue-tellement-activity-6775682949720375296-pu05