Des textes antiques fragmentaires enfin révélés grâce à l’IA

72 % de précision : ce sont les résultats avancés par l’outil IA de l’entreprise DeepMind dans la restauration de textes grecs anciens sérieusement endommagés. Une révolution en perspective pour les domaines de la paléographie et de l’histoire antique quand on sait que la plupart des inscriptions qui ont survécu de l’époque antique nous sont parvenues incomplètes, voire illisibles. 

Le big data appliqué à l’Antiquité

Le machine learning, ou apprentissage automatique, est l’une des techniques principales pour façonner des algorithmes d’intelligence artificielle. Elle consiste à laisser ces algorithmes découvrir des patterns à partir de l’utilisation d’une masse de données, ou big data, à traiter par la machine. Si le deep learning, version améliorée du machine learning où sont modelées des sortes de neurones artificiels, nécessite la plupart du temps des millions de données au minimum, ici, il faudra se contenter de moins – les sources antiques sont loin de pouvoir fournir autant d’informations. 

Pour instruire Ithaca, l’équipe d’historiens et de scientifiques de DeepMind a utilisé, au départ, environ 178.000 textes grecs anciens, datés entre 700 avant JC et 500 après JC (déjà étudiés et connus), nous apprend l’étude parue dans la revue Nature. L’équipe a masqué certains des caractères dans les textes, puis a comparé les prédictions d’Ithaca avec les textes intégraux. 

Mosaïque des auteurs grecs, Métrodore de Lampsaque (philosophe grec de l’école épicurienne), seconde moitié du IIe ou début du IIIe siècle après J.-C., trouvée à Autun (Augustodunum), Musée Rolin, Autun, France (Carole Raddato, CC BY-SA 2.0) 

L’équipe chargée du projet a ensuite utilisé près de 8000 inscriptions, toujours déjà bien étudiées et comprises, pour tester la performance d’Ithaque seule, ou en combinaison avec deux historiens anciens. À lui seul, Ithaca pouvait restaurer des textes avec une précision de 62 %, tandis que les historiens seuls ont terminé avec une précision d’environ 25 %.

A LIRE:À la recherche des auteurs de la Bible grâce à l’IA

L’historienne Thea Sommerschield de l’Université Ca’ Foscari à Venise, mobilisée pour ce projet, ajoute que cet algorithme remplit bien les trois objectifs nécessaires à la réussite d’un déchiffrage. Car oui, restaurer le texte ne suffit pas.

L’importance de la localisation et de la datation

Pour réussir à récupérer un texte parcellaire, avec la récupération des mots, il est impératif de déterminer exactement quand et où ce texte a été écrit. Pour réussir cette contextualisation, les historiens tentent de retrouver des motifs et caractéristiques distinctifs dans le style d’écriture. Et ce, avant de les comparer à des textes anciens déjà identifiés.

1650080920 510 Des textes antiques fragmentaires enfin reveles grace a lIA

Inscription de Gallio, Musée Archéologique de Delphes (Andy Montgomery, CC BY-SA 2.0)

Là encore, l’IA est d’un grand secours. En effet, l’algorithme Ithaca peut également prédire où dans le monde méditerranéen antique, les textes ont été écrits avec une précision de 71 %. De même, il parvient à les dater avec une précision de 30 années. C’est ici que se révèle en réalité l’apport principal d’Ithaca, sachant qu’une version antérieure de l’IA, créée en 2019, ne parvenait qu’à restaurer des textes anciens, sans les autres informations.

« Il est clair que le travail proposé  par les historiens et scientifiques du projet est ici important et révolutionnaire. La méthode « historien ancien et Ithaca » produit des améliorations étonnamment significatives des résultats par rapport aux méthodes traditionnelles exclusivement humaines », a déclaré Tom Elliott à l’Université de New York, repris par NewScientist.

A LIRE:L’intelligence artificielle au service du livre et de la lecture

Une réflexion qui rejoint l’expérience. Les reconstructions les plus précises ont été celles qui impliquaient en commun, l’algorithme et le travail des historiens. Lorsque ces derniers se sont appuyés sur les 20 reconstructions jugées les plus probables par Ithaca pour un texte donné, il les ont ensuite utilisées pour soutenir leurs propres travaux. Il s’est alors révélé que la restauration du texte était réalisée avec une précision encore plus grande qu’avec Ithaca seul.

« Des tests supplémentaires avec plus d’historiens restent en revanche nécessaires. Les chercheurs auront également besoin d’une formation et d’un soutien technique pour utiliser l’outil », ajoute encore Tom Elliott. Un algorithme qui devra à présent être transposé à d’autres langues anciennes, comme à d’autres types d’écrits, de quoi offrir de belles perspectives aux épigraphistes du monde.

Crédits : Sardes. Le Complexe Bains-Gymnasium – La “Salle de Marbre”, Inscription Dédicatoire, Egisto Sani (CC BY-SA 2.0) 

We would love to give thanks to the author of this post for this amazing material

Des textes antiques fragmentaires enfin révélés grâce à l’IA

You can find our social media profiles here and other pages on related topics here.https://www.ai-magazine.com/related-pages/