Le dernier scandale en date sur l’écriture par IA est arrivé, comme il se doit, avec le Pape. Le 25 mai 2026, le Vatican a publié la première encyclique du pape Léon XIV, Magnifica Humanitas, datée du 15 mai, consacrée à la protection de la personne humaine à l’ère de l’intelligence artificielle. En quelques jours, des gens l’ont soumise à Pangram, le détecteur devenu soudain l’instrument respectable de la suspicion littéraire et universitaire. Certains passages auraient été signalés comme assistés par IA, et l’accusation était facile à comprendre : le Pape, ou du moins le Vatican, avait utilisé l’IA pour écrire sur l’IA.
Ma réaction a été en gros : d’accord, et ensuite ? Les encycliques passent déjà par une rédaction institutionnelle, un travail de staff, des consultations, des révisions, des traductions et un lissage de type comité. Si un responsable du Vatican a utilisé Claude pour transformer les idées du pape Léon en prose, les questions pertinentes resteraient de savoir si le document est exact, réfléchi et digne d’être lu. Mais je dois reconnaître que j’avais tort.
Dans la deuxième partie de ma série sur l’IA, j’écrivais que les détecteurs d’écriture par IA étaient mauvais et le resteraient probablement. Pangram m’a fait changer d’avis : il s’appuie sur des preuves indépendantes, revendique un taux de faux positifs très bas et est devenu le détecteur vers lequel les gens se tournent quand ils soupçonnent une écriture par IA non divulguée. Kelsey Piper a récemment écrit sur les affirmations de Pangram Labs selon lesquelles plusieurs nouvelles primées étaient générées par IA ou largement assistées par IA, et Matteo Wong, de The Atlantic, a désormais écrit sur le pouvoir croissant de Pangram dans les écoles, l’édition, le journalisme et l’économie de l’accusation d’écriture par IA.
Un détecteur qui fonctionne rend l’éthique plus urgente, car il pousse à traiter la provenance comme un verdict. C’est pourquoi la blague consistant à utiliser Pangram pour filtrer les contenus écrits par des humains est plus mordante qu’elle n’en a l’air : dans bien des contextes, une écriture assistée par IA peut être plus lisible et plus utile qu’une prose humaine non assistée. Si les données sous-jacentes sont solides, la lutte humaine au niveau de la phrase n’apporte pas grand-chose.
Je dois aussi être franc : je suis ici partie prenante. Je suis ce fameux professeur d’IA qui écrit fièrement avec l’aide de l’IA. Un essai soutenant que la détection d’IA peut devenir une police du statut social est, fort opportunément, une défense de ma propre pratique ; les lecteurs devraient donc se demander si je trace la ligne d’une manière qui m’arrange.
Le spectre de la provenance
L’éthique de l’écriture par IA commence par la promesse faite par l’auteur. Un auteur peut faire une promesse à un enseignant, un éditeur, un lecteur, une institution ou un destinataire. La question éthique dépend de cette promesse avant de dépendre du score d’un détecteur.
Commençons là où les sceptiques ont raison. Un devoir d’étudiant qui interdit explicitement l’IA est le cas évident. Un concours d’écriture créative qui promet de récompenser de nouveaux auteurs humains en est un autre. Un mot de condoléances appartient à une catégorie différente d’un examen, mais si une personne en deuil attend des mots de votre part, déléguer l’acte émotionnel à une machine ressemble à une trahison.
Certaines décisions exigent aussi un jugement humain responsable. Si je décide qu’une personne obtient une bourse ou une subvention, la provenance compte, parce que le candidat a droit à mon jugement. L’IA peut aider à organiser les éléments de preuve ou à vérifier la cohérence, mais l’acte d’évaluation doit rester le mien.
Les conséquences comptent aussi. Plus une décision est influente, et plus elle dépend du jugement personnel, plus l’argument en faveur de savoir qui ou quoi l’a prise est fort. La discrétion humaine peut également être pire que la discrétion de l’IA : un comité peut être biaisé ou arbitraire, et un système d’IA bien conçu pourrait, à terme, rendre certaines décisions plus cohérentes.
Il existe aussi une règle particulière pour les affirmations à la première personne. Quand j’écris « je pense » ou « je ressens », cette conviction devrait réellement être la mienne. L’IA peut m’aider à la formuler, à la mettre à l’épreuve ou à la rendre moins maladroite. Elle ne peut pas fournir la conviction elle-même.
La recherche et le journalisme se situent plus près du milieu. Une signature est une promesse que l’auteur assume les affirmations, les preuves et les choix de jugement. Elle n’a jamais signifié que l’auteur a personnellement tapé chaque phrase sans l’aide de moteurs de recherche, de correcteurs, de coauteurs, de traducteurs, ou maintenant de LLMs. Si mon nom figure sur un argument, l’argument doit être le mien ; la prose peut être assistée.
Une grande partie de l’écriture technique se rapproche du versant où c’est le contenu qui compte. Si je demande à l’IA de décrire un graphique, de rédiger un paragraphe de méthodes ou de traduire un résultat de régression en langage courant, la question importante est de savoir si le résultat est correct. Je dois encore vérifier les chiffres et assumer le texte final. L’exactitude et la responsabilité portent le poids moral.
À l’extrême se trouvent les messages administratifs où presque personne ne se soucie de l’acte humain d’écriture. Si un département vous demande d’envoyer un mot poli confirmant une réunion de comité, utilisez l’IA librement. Le seul critère pertinent est de savoir si le message est exact et clair.
Un score d’IA unique ne peut pas répondre à la question éthique. Un même niveau d’assistance par IA peut être inoffensif dans un courriel administratif, utile dans un rapport technique, discutable dans un essai personnel et rédhibitoire dans un devoir scolaire interdisant l’IA. Le contexte est l’essentiel, même lorsque la détection sous-jacente est exacte.
La détection aussi a un spectre
L’éthique de la détection devrait suivre l’éthique de l’usage. Si un enseignant a demandé aux étudiants d’écrire sans IA pour un devoir donné, un détecteur peut faire partie d’un processus d’intégrité académique. Un score Pangram ne devrait jamais être la seule preuve, surtout compte tenu des enjeux pour les étudiants.
Les concours créatifs sont confrontés à un problème similaire. L’argument de Piper sur le Commonwealth Short Story Prize mérite d’être pris au sérieux, car les prix de fiction portent en partie sur le métier humain. Si un prix récompense la voix d’un auteur humain, une candidature entièrement générée par IA viole le principe même. L’organisateur peut autoriser l’IA, l’interdire ou créer une catégorie distincte. La confiance seule ne réglera pas le problème.
L’évaluation par les pairs est plus délicate. Seth Lazar a donné la version la plus forte de l’argument en faveur de la détection, en réponse à mon précédent billet sur Pangram : la production de recherche générée par IA peut devenir une attaque par déni de service contre l’évaluation par les pairs. Le coût de production d’articles à l’apparence plausible s’effondre, tandis que l’obligation de les lire reste coûteuse. Dans ce contexte, un détecteur peut aider à préserver une capacité d’évaluation rare.
L’argument de l’évaluation par les pairs dépend tout de même de l’objectif. Si le but est de prendre en faute des étudiants enfreignant une règle explicite, la provenance est la cible. Si le but est de protéger les évaluateurs de soumissions sans valeur, la provenance n’est qu’un indicateur indirect : un détecteur estime la probabilité qu’un texte soit issu de l’IA, jamais la probabilité qu’il soit mauvais. La vraie cible est le mauvais travail : données hallucinées, citations fabriquées, méthodes inexistantes et articles sans question digne d’être posée. Un détecteur peut aider à en trier une partie, mais quelqu’un doit toujours vérifier les affirmations elles-mêmes.
Ma crainte est que nous fassions la police des tirets cadratins tout en ignorant les données hallucinées qu’ils recouvrent. Ce serait une manière très universitaire de passer à côté de l’essentiel : une attention exquise au marqueur de surface, et bien peu d’attention à la question de savoir si le texte dit quelque chose de vrai.
Pourquoi la divulgation échoue le plus souvent
Le compromis évident est la divulgation. Laisser les gens utiliser l’IA, leur imposer de le dire, et laisser les lecteurs décider de l’importance que cela revêt. Cela paraît séduisant, car cela traite l’assistance par IA comme une information et fait baisser la température morale.
J’ai soutenu dans la deuxième partie de la série sur l’IA que les normes de divulgation s’effondrent sous l’effet des incitations qu’elles créent. La moitié de cet argument portant sur les détecteurs doit désormais être révisée, car Pangram semble fonctionner bien mieux que je ne l’attendais. La moitié portant sur la divulgation me paraît toujours juste.
Plus l’usage de l’IA est moralement discutable, plus l’incitation à le cacher est forte. Un étudiant qui a utilisé l’IA après avoir promis d’écrire sans aide, un candidat à un concours qui a soumis une fiction écrite par machine à un prix réservé à l’écriture humaine, ou un chercheur qui a utilisé l’IA pour masquer de fausses citations : tous ont toutes les raisons de garder le silence.
Les personnes les plus susceptibles de divulguer sont celles qui utilisent l’IA de manière peu risquée : nettoyer un paragraphe, traduire un graphique ou transformer des notes brutes en prose lisible qu’elles assument toujours. Ce sont aussi les cas où la divulgation importe le moins. L’équilibre probable est un monde rempli de reconnaissances rituelles d’une assistance par IA inoffensive, tandis que les cas véritablement trompeurs restent cachés jusqu’à ce que quelqu’un enquête.
La divulgation peut tout de même aider lorsqu’elle explique le travail elle-même, comme c’est le cas ici. Les éditeurs, enseignants, jurys de prix et personnes exerçant une autorité institutionnelle devraient aussi être clairs sur les règles qu’ils appliquent. Mais si tout le système repose sur l’aveu honnête, il punira les consciencieux et laissera tranquilles les usagers stratégiques.
La nouvelle police de la grammaire
Je sais que l’expression « police de la grammaire » est brutale, et j’entends par là quelque chose de précis. Je suis né en Union soviétique, et la culture des élites russes peut être extrêmement sensible à la grammaire, à la prononciation, aux schémas d’accentuation et aux petits marqueurs de statut nichés dans le langage. En pratique, la correction grammaticale faisait souvent office de tri social : la mauvaise école, la mauvaise région, le mauvais milieu familial ou le mauvais type d’éducation pouvaient transparaître dans votre façon de parler.
L’Amérique a sa propre version de cela. L’anglais universitaire est plein de signaux de statut déguisés en normes. Le bon type d’aisance vous fait paraître intelligent avant même que quiconque vérifie si vous avez raison, et le mauvais accent ou la mauvaise tournure peut vous marquer comme peu sérieux avant même que votre argument ait droit à une audience.
La détection d’IA transforme cette vieille habitude en un nouveau rituel technique. Les mêmes personnes qui faisaient autrefois la police de la grammaire font maintenant la police des « signes d’IA » : tirets cadratins, transitions trop fluides, métaphores génériques, paragraphes étrangement équilibrés, prose qui paraît un peu trop nette. Parfois, elles ont raison. L’écriture par IA présente bien des schémas reconnaissables, ce qui explique pourquoi j’ai un guide de style qui en est plein.
Si quelqu’un lit un texte, y apprend quelque chose de nouveau, puis ramène la conversation à une seule formulation suspecte, l’instinct « Pangrammaire » a fait perdre du temps à tout le monde. L’attention d’un lecteur devrait aller d’abord à l’affirmation, aux preuves et à ce qu’il en retire, la police du style étant réservée aux cas où la prose empêche réellement la compréhension ou signale une tromperie.
Cette dynamique de statut est très familière. Le score du détecteur offre un permis d’apparence scientifique pour écarter un travail sans le lire attentivement. Ceux qui en profitent sont généralement les auteurs établis et les gardiens diplômés qui peuvent transformer un jugement en score. L’accusation devient particulièrement commode contre les auteurs de statut inférieur et les personnes qui n’écrivent pas bien en anglais mais peuvent désormais utiliser l’IA pour traduire, rédiger et atteindre un public anglophone. Trop poli, cela paraît faux. Trop maladroit, cela paraît de mauvaise qualité. Dans les deux cas, le gardien gagne.
La logique de la contamination morale aggrave le problème. Dès lors que l’implication de l’IA est traitée comme une impureté, la moindre trace d’assistance suffit à condamner l’ensemble du travail. C’est un critère étrange pour un monde où l’écriture humaine a toujours été socialement produite par des éditeurs, des évaluateurs, des coauteurs, des traducteurs et la phrase que vous avez lue hier.
L’équilibre le plus drôle possible est déjà là. Les outils d’IA produisent une prose trop claire, les détecteurs punissent cette clarté, puis de nouveaux outils « humanisateurs » réécrivent la prose pour la rendre plus maladroite. TIME a récemment décrit des gens qui insèrent des fautes et des bizarreries pour éviter de paraître générés par IA. C’est Grammarly à l’envers : dégrader l’écriture pour qu’elle paraisse plus authentique.
Que faire à la place
Je plaide pour une modestie des détecteurs. Pangram ne devrait être utilisé que là où la provenance fait partie de l’accord : examens avec interdiction explicite de l’IA, concours qui promettent un savoir-faire humain, ou contextes institutionnels où la source du texte fait partie du travail. La règle institutionnelle devrait être écrite avant que le score ne soit consulté : définir quel usage de l’IA violerait la promesse et quelle procédure d’appel suit un score élevé.
Dans de nombreux domaines, la norme devrait être assez simple : si vous mettez votre nom sur un travail, vous l’assumez. Vous assumez les faits, les affirmations, les erreurs, le goût, la structure et le jugement. Si l’IA vous a aidé à produire un résumé technique exact, tant mieux. Si l’IA vous a aidé à produire des absurdités plus vite, c’est votre responsabilité.
Parce que l’attention est rare, les gens continueront de s’appuyer sur des raccourcis. Ils feront confiance aux noms qu’ils connaissent, aux revues qu’ils respectent, aux éditeurs qui ont fait leurs preuves, aux amis qui ont lu le travail et aux institutions qui ont quelque chose à perdre si elles publient des inepties. C’est imparfait et souvent injuste. Les outsiders et les nouveaux venus paient un prix lorsque la réputation devient le filtre. Mais au moins, la réputation est responsable dans la durée. Si une revue, un prix, un professeur ou un auteur ne cesse de cautionner du mauvais travail, les gens peuvent le remarquer.
Un score Pangram, c’est différent. Il donne une estimation rapide de la provenance d’un texte et nous invite à cesser de lire avant même de nous être demandé ce que le texte fait. Pangram semble fonctionner, si bien que la question n’est plus de savoir si nous pouvons détecter l’IA. La question est de savoir ce que nous devrions faire de cette information. À utiliser quand la provenance fait partie du marché et que les enjeux justifient une enquête. À traiter comme une invitation au jugement, jamais comme un substitut au jugement.
Si le travail est faux, erroné, plagié, émotionnellement frauduleux ou contraire à une règle claire, dites-le et agissez en conséquence. Si le travail est exact, utile et assumé par la personne dont le nom y figure, le fait que Codex, Claude ou ChatGPT ait aidé à assembler les phrases est une base bien faible pour un scandale. Le scandale serait de bâtir une culture où chacun apprend à dégrader son écriture pour qu’elle puisse passer pour humaine.
Une dernière divulgation, puisque tout le texte porte sur cette question : l’essai ci-dessus a été entièrement écrit dans Codex à partir de plusieurs heures de mes réflexions dictées, de billets antérieurs, d’instructions de style enregistrées et d’échanges récents sur les réseaux sociaux. L’image de couverture et le graphique du spectre ont également été produits par Codex. Ce n’était pas une invite unique. Nous avons procédé à plus d’une douzaine d’itérations, surtout pour affiner l’argument et le graphique. Oui, j’utilise désormais Codex plus que Claude Code. Oui, j’ai lu le brouillon avant publication, mais je n’ai pas du tout retouché la prose. D’après mon propre graphique, cet essai se situe du côté « le contenu compte » du spectre, et je l’assume.
