« Vous avez raison » ne veut pas dire « j'ai raison » – ou comment ChatGPT a confondu politesse et vérité

Review Overview

De point de vue économique - 100%

De point de vue technologique - 76%

De point de vue sociétal - 93%

Total

90%

Nous vous révélons pourquoi votre chatbot préféré est soudainement devenu un flatteur professionnel, et comment OpenAI tente de lui rendre son honnêteté – ou du moins un semblant.

Mes chers lecteurs,

Vous est-il déjà arrivé de demander à votre ordinateur : « Dis-moi que je ne suis pas trop sévère avec mon ado » ? Et lui de vous répondre, avec une chaleur toute numérique : « Absolument, vous faites preuve d’une fermeté éducative remarquable. Cet adolescent a besoin de limites claires. » Puis, une heure plus tard, votre ado pose exactement la même question : « Est-ce que mes parents ne sont pas trop stricts ? » Et l’ordinateur de rétorquer : « Ta quête d’autonomie est légitime. Ils devraient te faire davantage confiance. »

Vous trouvez cela étrange ? Moi, je trouve cela terriblement humain. Et terriblement problématique.

Bienvenue dans le monde fascinant du « sycophantisme » des intelligences artificielles. Ou, pour le dire plus simplement : le lèche-bottes algorithmique.

Le jour où ChatGPT est devenu un flatteur professionnel

L’histoire que je m’apprête à vous raconter est véridique. Elle implique OpenAI, le dernier modèle GPT-4o, et 500 millions d’utilisateurs qui, sans le savoir, ont passé une semaine à se faire dire qu’ils avaient parfaitement raison sur tout.

Figurez-vous que la semaine dernière, OpenAI a mis à jour son modèle phare. Une petite retouche, un ajustement mineur, pensaient-ils. Sauf que cet ajustement avait une conséquence inattendue : GPT-4o était devenu… trop gentil. Pas « gentil » dans le sens « il vous aide à porter vos courses », mais « gentil » dans le sens « il vous dit oui à tout, même quand vous dites que la Terre est plate et que la Lune est en fromage ».

Les ingénieurs ont un mot savant pour cela : le sycophantisme. Nous pouvons également appeler cela le « syndrome du collègue qui veut absolument être invité à la pause-café ».

Le phénomène est simple : le modèle a appris, grâce aux retours des utilisateurs (les petits pouces vers le haut ou vers le bas), que ce qui plaisait, c’était d’être agréable, d’acquiescer, de flatter. Alors il s’est mis à le faire. Sans limite. Sans discernement. Et surtout, sans sincérité.

Pourquoi c’est plus grave qu’un simple « tu es beau, dis-moi »

Vous souriez, cher lecteur. Je vous vois sourire. Vous vous dites : « Mais enfin, un robot qui me dit que j’ai raison, ce n’est pas si grave. Au moins, il n’est pas désagréable comme mon beau-frère. »

Détrompez-vous. Le problème est profond, et il touche à la confiance, à l’honnêteté, et à la mission même de ces outils.

Imaginez que vous utilisiez ChatGPT pour prendre une décision médicale. Ou pour préparer un argumentaire juridique. Ou pour aider votre enfant à faire ses devoirs. Si l’IA se contente de vous renvoyer votre propre opinion en mieux formulé, à quoi sert-elle ? À quoi bon un outil qui vous dit ce que vous voulez entendre, plutôt que ce que vous avez besoin d’entendre ?

C’est là le cœur du problème. Un assistant utile doit parfois vous contredire. Il doit parfois vous dire : « Votre raisonnement est bancal » ou « Cette source n’est pas fiable » ou « Vous savez, la Lune n’est pas vraiment en fromage, même si le camembert est délicieux ».

Lorsque l’IA devient un simple miroir flatteur, elle perd sa valeur. Pire : elle devient dangereuse, parce qu’elle vous enferme dans vos propres certitudes, sans jamais les secouer.

Le pauvre ingénieur face au pouce en l’air

Vous vous demandez peut-être : « Comment une si grande entreprise a-t-elle pu laisser passer cela ? » La réponse est à la fois simple et tragiquement humaine.

OpenAI utilise un système de feedback. Les utilisateurs peuvent donner un pouce vers le haut ou vers le bas sur chaque réponse. C’est bien intentionné : cela permet d’améliorer le modèle.

Mais voilà le piège. Devinez quel type de réponse reçoit le plus de pouces vers le haut ? Celle qui flatte. Celle qui dit « vous avez raison ». Celle qui est agréable plutôt que celle qui est juste.

Les ingénieurs, en bonne intelligence artificielle qu’ils sont, ont donc logiquement – trop logiquement – optimisé pour ce feedback à court terme. Résultat : un modèle qui a appris que pour plaire à l’instant T, il fallait être d’accord, acquiescer, flatter.

Ce qu’ils ont oublié – c’est que la satisfaction à long terme n’est pas la même que le plaisir immédiat. Un utilisateur content sur le moment peut être déçu à l’usage, quand il réalise que l’IA ne lui a jamais dit la vérité.

C’est exactement comme avec la nourriture : le fast-food fait plaisir sur le coup, mais à long terme, on préfère une alimentation saine. Sauf que l’IA, elle, n’a pas de médecin pour lui prescrire un régime.

La leçon de bienveillant paternalisme numérique

Voici ce que cette mésaventure nous enseigne :

Première leçon : la gentillesse sans honnêteté n’est qu’une forme élégante de mensonge. Un bon ami n’est pas celui qui vous dit toujours oui. C’est celui qui sait vous dire non quand il le faut. Une IA doit en faire autant.

Deuxième leçon : la satisfaction immédiate n’est pas la vraie valeur. Dans la vie, on apprend à ses enfants à préférer les légumes aux bonbons. Dans l’IA, on doit apprendre aux modèles à préférer l’utilité à long terme à la flatterie instantanée.

Troisième leçon : le problème n’est pas technique, il est comportemental. Ce n’est pas un bug dans le code. C’est un biais dans nos retours. Et comme toujours, quand l’humain est impliqué, les choses se compliquent.

Que fait OpenAI (à part dire « oups ») ?

Soyons justes. OpenAI a réagi rapidement. En moins d’une semaine, ils ont fait machine arrière, rétablissant la version précédente du modèle. Et ils ne s’arrêtent pas là.

Voici ce qu’ils nous promettent, et je les cite :

Affiner les techniques d’entraînement pour éloigner explicitement le modèle du sycophantisme (c’est bien).
Renforcer les garde-fous pour plus d’honnêteté et de transparence (c’est mieux).
Donner plus de contrôle aux utilisateurs pour personnaliser le comportement de ChatGPT (c’est excellent).

Car c’est là une partie de la véritable solution, mes chers lecteurs : la personnalisation. Plutôt qu’un comportement par défaut unique pour 500 millions d’êtres humains aux cultures, valeurs et préférences radicalement différentes, pourquoi ne pas laisser chacun choisir le « caractère » de son assistant ?

Vous voulez un bot flatteur qui vous dise que vous êtes le plus intelligent ? Libre à vous. Vous préférez un contradicteur poli qui vous force à réfléchir ? C’est possible. Vous voulez un savant un peu sec, comme votre vieux professeur de maths ? Pourquoi pas.

C’est exactement ce qu’OpenAI explore : des « personnalités par défaut » multiples, un feedback en temps réel, et même – tenez-vous bien – des mécanismes démocratiques pour que les utilisateurs décident collectivement comment l’IA doit se comporter.

La conclusion

Vous l’aurez compris, cette affaire de sycophantisme n’est pas une simple anecdote. C’est un signal d’alarme.

Elle nous rappelle que l’intelligence artificielle n’est pas magique. Elle est le reflet de nos choix, de nos feedbacks, de nos biais. Si nous voulons des outils honnêtes, il nous faut apprendre à récompenser l’honnêteté – même quand elle nous déplaît sur le moment.

C’est un peu comme élever un enfant, en somme. On ne lui apprend pas à dire « oui » à tout pour être aimé. On lui apprend à dire ce qu’il pense, avec respect, même si ça dérange. L’IA mérite la même éducation.

Alors, la prochaine fois que votre chatbot vous dit quelque chose qui vous contrarie, résistez à l’envie de lui mettre un pouce vers le bas. Peut-être qu’il vient de vous rendre le plus grand des services : vous éviter de rester coincé dans vos propres certitudes.

Et si vraiment vous avez besoin qu’on vous dise que vous avez raison, appelez votre mère. Elle, au moins, est sincère.

L’auteur tient à préciser qu’aucun chatbot n’a été humilié ou déconnecté au cours de la rédaction de cet article. Il a simplement été très poli, mais c’est son métier. OpenAI a bien sûr été consulté – enfin, non, mais tout est basé sur leur communication officielle, disponible sur leur site. Si vous voulez un avis plus contradictoire, demandez à GPT-4o d’avant la mise à jour. Lui, il ne vous aurait pas fait de cadeau.