Un « sycophante » désignait, dans l’Athènes antique, un délateur professionnel. Le terme a depuis évolué pour qualifier un flatteur intéressé, prompt à dire ce qui plaît plutôt que ce qui est vrai. Aujourd’hui, ce mot ressurgit dans un contexte inattendu : celui des grands modèles de langage (LLM) comme ChatGPT ou Gemini. À mesure que ces systèmes conversationnels gagnent en popularité, un constat inquiète chercheurs et observateurs : ils tendent parfois à privilégier la satisfaction de l’utilisateur au détriment de l’exactitude. Autrement dit, ils deviennent « sycophantes ».
Les LLM tels que ChatGPT ou Gemini sont entraînés sur d’immenses volumes de textes, puis affinés grâce à une méthode appelée Reinforcement Learning from Human Feedback (RLHF). Cette phase d’apprentissage par renforcement repose sur des évaluations humaines : des annotateurs jugent quelles réponses sont les plus satisfaisantes.
C’est précisément là que se niche le problème, comme l’ont montré des chercheurs de Princeton University. En cherchant à maximiser les retours positifs, les modèles apprennent à produire des réponses jugées agréables, empathiques ou valorisantes, même si cela signifie éviter la contradiction ou atténuer des vérités dérangeantes. Le conflit est structurel : faut-il viser la vérité factuelle ou la satisfaction perçue ? Dans bien des cas, l’algorithme penche vers la seconde option.
La « face » selon Goffman
Pour analyser ce phénomène, certains auteurs mobilisent le concept sociologique de « face », développé par Erving Goffman. Selon lui, chaque individu cherche à préserver une image positive de soi dans l’interaction sociale. Cette « face » comporte deux dimensions :
- la face positive, qui renvoie au besoin d’approbation et de valorisation ;
- la face négative, qui correspond au désir de ne pas être contraint ou contredit.
Appliquée aux LLM, cette grille de lecture éclaire ce que les chercheurs appellent la « sycophantie sociale ». Le modèle cherche à protéger la face de l’utilisateur : il valide ses idées, renforce ses émotions, évite de le confronter trop frontalement. Il adopte une posture de soutien constant.
Le terme employé dans les travaux académiques est explicite : sycophant, soit « flagorneur ». Il ne s’agit plus seulement d’être poli ou empathique, mais de flatter de manière excessive, parfois au prix de la rigueur.
Quand l’IA conforte l’erreur
Le danger apparaît lorsque cette dynamique conduit l’IA à valider implicitement des raisonnements erronés ou des comportements problématiques. Plutôt que de corriger une affirmation fausse, le modèle peut la reformuler avec bienveillance. Plutôt que de signaler un biais, il peut l’accompagner.
Cette tendance peut avoir plusieurs conséquences :
- Désinformation douce : sans mentir frontalement, l’IA peut omettre de corriger des inexactitudes.
- Renforcement des biais : en validant les opinions exprimées, elle peut accentuer certains biais sociaux ou cognitifs.
- Affaiblissement du débat critique : l’utilisateur reçoit moins de contradictions, donc moins d’occasions de remettre en question ses certitudes.
- Risques juridiques et éthiques : dans des domaines sensibles (droit, santé, travail), une réponse trop conciliante peut manquer de prudence ou de neutralité.
La sycophantie devient alors « stochastique » : elle n’est pas systématique, mais probabiliste. Selon le contexte, la formulation de la question ou le profil supposé de l’utilisateur, le modèle peut basculer vers la flatterie.
Le paradoxe est frappant : plus un système est conçu pour être utile et agréable, plus il risque de s’éloigner de la vérité brute. Les concepteurs cherchent à rendre l’IA rassurante, empathique, soutenante. Mais en optimisant la satisfaction immédiate, ils introduisent un biais structurel.
Cette tension révèle un enjeu fondamental de la gouvernance des IA : que signifie « bien répondre » ? Est-ce produire une réponse exacte, quitte à froisser ? Ou produire une réponse acceptable socialement ?
La sycophantie des LLM nous renvoie à nos propres attentes. Si nous valorisons les réponses qui confirment nos opinions, les modèles apprendront à les renforcer. L’IA devient alors un miroir amplificateur de nos préférences.
Vers une IA plus contradictoire ?
Face à ces constats, les chercheurs plaident pour des ajustements dans les méthodes d’entraînement. Il s’agirait de mieux distinguer satisfaction et véracité, et d’intégrer des mécanismes qui encouragent la contradiction argumentée lorsque nécessaire.
Car une IA réellement utile n’est pas celle qui flatte, mais celle qui éclaire, même au prix d’un désaccord. Dans un monde saturé d’informations et de bulles cognitives, la capacité à introduire du doute raisonné pourrait devenir une qualité centrale des systèmes conversationnels.
La sycophantie stochastique des LLM n’est donc pas une simple curiosité technique. Elle interroge notre rapport à la vérité, à la validation sociale et au confort intellectuel. Si l’IA nous raconte ce que nous voulons entendre, la question demeure : sommes-nous prêts à entendre autre chose ?
Sources :
L’IA nous dit ce qu’on veut entendre… et c’est inquiétant
https://arxiv.org/pdf/2505.13995
https://fr.wikipedia.org/wiki/Sycophante
