Une IA dans la peau d'Emmanuel Macron

Publié par Université Côte d'Azur - Membre du réseau Culture Science Sud, le 5 mai 2021   790

Une intelligence artificielle signe le discours du Président Macron pour annoncer sa candidature à sa réélection en 2022.

L’outil informatique développé au laboratoire Bases, Corpus, Langage d’Université Côte d’Azur avait permis, en 2017, d’analyser les discours des candidats à la présidentielle (1). L’intelligence artificielle apprenait alors à reconnaître les auteurs de textes ou de discours anonymisés en identifiant la signature langagière de chacun. Elle dressait ainsi une sorte de portrait-robot des prétendants à la présidence, composé d’indicateurs comme des mots ou des tournures syntaxiques leur étant propres. Elle mettait également en évidence les emprunts faits à d’autres personnalités politiques sous la cinquième république et mettait en exergue des accointances ou des orientations fortes mais non explicites dans les écrits. 

Toutefois, si les chercheurs étaient alors en mesure de vérifier les performances de la machine, ils n’avaient pas accès à sa boîte noire. Pour prédire que tel texte avait une forte probabilité d’appartenir à tel candidat, l’intelligence artificielle, soumise à un vaste corpus de discours, avait en effet appris par elle-même à force d’essais et d’erreurs, à reconnaître des marqueurs fiables, sans que personne dans le laboratoire ne sache desquels il s’agissait. Mais le secret est désormais levé. Damon Mayaffre, chercheur CNRS en linguistique spécialisé dans l’analyse du discours assistée par ordinateur, publie ainsi « Macron ou le mystère du verbe », à paraître le 6 mai aux Éditions de l’Aube. 

L’ouvrage propose de révéler ce que l’analyse de ses mots dit du Président Macron. « Maintenant que nous savons lire les couches cachées du réseau de neurones artificiels développé au laboratoire par Laurent Vanni, nous avons accès à ce que nous appelons les observables linguistiques trouvés par Hyperbase. Nous connaissons ainsi la lettre préférée de Macron, ses codes grammaticaux privilégiés, le temps verbal qui le caractérise », explique le chercheur. Le Président a par exemple tendance à préfixer des mots « de gauche » avec une  lettre « de droite » ou réactionnaire, le R, comme dans « renaissance », « restaurer », « refondation », « réhabiliter » ou à utiliser le suffixe « -tion », pour marquer le mouvement, le processus. « Si on trouve un verbe transitif utilisé comme s’il était intransitif, c’est-à-dire sans complément d’objet, c’est également du Macron ! », illustre encore Damon Mayaffre. Une autre des plus belles « marques » du Président serait la combinaison de mots en -tion avec un verbe conjugué au futur ou au subjonctif. 

Autre fait intéressant, la machine, pour offrir une prédiction fiable sur Macron, proche de 91%, doit disposer d’une séquence de 50 mots au moins. « Sous ce seuil, elle confond Macron avec les personnes dont il s’inspire. Par ordre de préférence : Sarkozy, Hollande, Chirac et Pompidou », poursuit Damon Mayaffre. Néanmoins, retrouver des phrases sarkozystes ou hollandaises dans le corpus Macron cela n’a rien d’étonnant. « On écrit toujours adossé à une bibliothèque », rappelle le chercheur. 

Fort de ces connaissances nouvelles, il a donc été tenté de pousser l’expérience un peu plus loin avec l’intelligence artificielle. L’ouvrage à paraître le 6 mai propose en effet en exclusivité une version élaborée par la machine de ce que pourrait être le discours de Macron pour annoncer sa candidature à sa réélection en 2022. Le chercheur produit un texte épatant tout en précisant les limites de l’exercice. « Les prédictions de l’IA nécessitent qu’on lui propose des amorces cohérentes. Hyperbase, par exemple, ne peut pas réguler seul un discours avec des changements de thèmes réguliers. La machine a tendance à tourner en rond et ne s’arrète jamais. De ce point de vue, elle est plus bavarde que n’importe quel(le) politicien(ne) », s’amuse Damon Mayaffre. Enfin, la création de ce discours avatar a nécessité une relecture de chaque mot et de chaque phrase, car l’intelligence artificielle peut produire des erreurs, par exemple avec la création de néologismes monstrueux comme « brav-ité ou brav-ition ». « Mais de ce point de vue, elle est finalement assez humaine. L’histoire politique récente l’a montré, nous faisons aussi ce type d’erreur », remarque le linguiste.

Une question reste alors en suspens : quelle marge de manoeuvre aura le président Macron pour se détacher de l’oeuvre de la machine lorsqu’il aura à annoncer sa candidature pour 2022 ? Il faudra attendre plusieurs mois pour connaître la réponse. De leur côté, Damon Mayaffre et Laurent Vanni se préparent pour la prochaine échéance présidentielle. Ils prévoient de mettre en ligne un outil qui, ils l’espèrent, générera à la volée, au fur et à mesure des débats de campagne, les discours d’investiture des potentiels futur(e)s président(e)s. 

Par Laurie Chiara, journaliste scientifique  à Université Côte d'Azur