Aller au contenu

Translations:Wiktionnaire:Actualités/115-octobre-2024/55/fr

Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.

Un article du Figaro nous rapporte comment, ces dernières années, l’intelligence artificielle a révolutionné la recherche historique sur la langue française. L’ordinateur a en effet appris à lire des vieux grimoires pour extraire les textes de nombreux volumes, une retranscription titanesque que personne ne peut humainement réaliser. Cette nouvelle technique se nomme HTR, de l’anglais Handwritten Text Recognition, sur le modèle de OCR, soit : reconnaissance des textes manuscrits. Elle a permis en particulier d’indexer la totalité des 200 registres de la chancellerie royale qui contiennent environ 80 000 pages de décisions prises par les rois de France au cours des XIVe et XVe siècles. La machine correctement entraînée est capable de transcrire tous les mots, y compris les abréviations usuelles. Non seulement la recherche dans ces documents s’en trouve grandement facilitée, mais il est aussi possible de faire des analyses de fréquence et de démontrer par exemple que l’utilisation du mot « sorcellerie » s’est répandue à la fin du Moyen Âge, ou que le latin a été remplacé par le français dans les actes à la fin du XIIIe siècle. Enfin, en plus de cette tâche qui n’aurait jamais pu être accomplie manuellement, l’IA a réalisé une chose littéralement impossible pour un être humain sur une telle quantité d’écrits : reconnaître les différentes écritures et dénombrer les auteurs du corpus !