O mais recente escândalo de escrita com IA chegou, apropriadamente, junto com o Papa. Em 25 de maio de 2026, o Vaticano publicou a primeira encíclica do Papa Leão XIV, Magnifica Humanitas, datada de 15 de maio, sobre a salvaguarda da pessoa humana na era da inteligência artificial. Em poucos dias, as pessoas já estavam submetendo o texto ao Pangram, o detector que de repente se tornou o instrumento respeitável da suspeita literária e acadêmica. Algumas partes foram aparentemente sinalizadas como assistidas por IA, e a acusação era fácil de entender: o Papa, ou pelo menos o Vaticano, teria usado IA para escrever sobre IA.
Minha reação foi basicamente: tudo bem, e daí? As encíclicas já passam por redação institucional, trabalho de assessoria, consulta, revisão, tradução e um polimento quase de comitê. Se algum funcionário do Vaticano usou o Claude para transformar as ideias do Papa Leão em prosa, as perguntas relevantes continuariam sendo se o documento é preciso, ponderado e digno de leitura. Mas devo admitir que eu estava errado.
Na Parte II da minha série sobre IA, escrevi que os detectores de escrita com IA eram ruins e provavelmente continuariam ruins. O Pangram me fez mudar de ideia: ele tem evidências independentes que o respaldam, afirma ter uma taxa de falsos positivos muito baixa e se tornou o detector que as pessoas recorrem quando suspeitam de escrita com IA não declarada. Kelsey Piper escreveu recentemente sobre as afirmações da Pangram Labs de que vários contos premiados foram gerados por IA ou substancialmente assistidos por ela, e Matteo Wong, da The Atlantic, já escreveu sobre o poder crescente do Pangram nas escolas, no mercado editorial, no jornalismo e na economia das acusações de escrita com IA.
Um detector que funciona torna a ética mais urgente porque tenta as pessoas a tratar a procedência como um veredicto. É por isso que a piada de usar o Pangram para filtrar conteúdo escrito por humanos é mais afiada do que parece à primeira vista: em muitos contextos, a escrita assistida por IA pode ser mais legível e mais útil do que a prosa humana sem ajuda. Se os dados por baixo são sólidos, a luta humana no nível da frase contribui pouco.
Devo também ser franco quanto ao fato de que sou parte interessada aqui. Sou aquele infame professor de IA que escreve com orgulho com a ajuda da IA. Um ensaio defendendo que a detecção de IA pode virar policiamento de status é convenientemente uma defesa da minha própria prática, então os leitores deveriam se perguntar se estou traçando a linha de uma forma que me favorece.
O espectro da procedência
A ética da escrita com IA começa pela promessa que o escritor fez. Um escritor pode fazer uma promessa a um professor, editor, leitor, instituição ou destinatário. A questão ética depende dessa promessa antes de depender da pontuação de um detector.
Comecemos por onde os céticos têm razão. Uma tarefa escolar que proíbe explicitamente a IA é o caso óbvio. Um concurso de escrita criativa que promete reconhecer novos escritores humanos é outro. Uma nota de condolências pertence a uma categoria diferente da de uma prova, mas, se alguém que está de luto espera palavras suas, terceirizar o ato emocional para uma máquina parece uma traição.
Algumas decisões também exigem um julgamento humano responsável. Se eu estou decidindo se alguém recebe uma bolsa ou um financiamento, a procedência importa porque o candidato tem direito ao meu julgamento. A IA pode ajudar a organizar evidências ou verificar a consistência, mas o ato avaliativo precisa continuar sendo meu.
As consequências também importam. Quanto mais influente a decisão, e quanto mais ela depende de julgamento pessoal, mais forte é o argumento para saber quem ou o que tomou a decisão. A discrição humana também pode ser pior do que a da IA: um comitê pode ser tendencioso ou arbitrário, e um sistema de IA bem projetado pode, com o tempo, tornar algumas decisões mais consistentes.
Há também uma regra especial para afirmações em primeira pessoa. Quando escrevo “eu acho” ou “eu sinto”, essa convicção deveria de fato ser minha. A IA pode me ajudar a formulá-la, testá-la sob pressão ou torná-la menos desajeitada. Mas não pode fornecer a convicção em si.
A pesquisa e o jornalismo ficam mais perto do meio. Uma assinatura é a promessa de que o autor responde pelas afirmações, pelas evidências e pelas decisões de julgamento. Nunca significou que o autor digitou pessoalmente cada frase sem a ajuda de mecanismos de busca, revisores, coautores, tradutores ou, agora, LLMs. Se meu nome está em um argumento, o argumento precisa ser meu; a prosa pode ser assistida.
Boa parte da escrita técnica fica mais perto do lado em que o conteúdo é o que importa. Se peço à IA que descreva um gráfico, escreva um parágrafo de metodologia ou traduza um resultado de regressão para o português comum, a pergunta importante é se o resultado está correto. Eu ainda preciso verificar os números e responder pelo texto final. A precisão e a responsabilidade carregam o peso moral.
No extremo oposto estão as mensagens administrativas em que quase ninguém se importa com o ato humano de escrever. Se um departamento pede que você envie um bilhete educado confirmando uma reunião de comitê, use a IA à vontade. O padrão relevante é se o bilhete é verdadeiro e claro.
Uma única pontuação de IA não pode responder à questão ética. O mesmo nível de assistência por IA pode ser inofensivo em um e-mail administrativo, útil em um relatório técnico, questionável em um ensaio pessoal e desqualificante em uma tarefa de sala de aula sem IA. O contexto é o ponto central, mesmo quando a detecção subjacente é precisa.
A detecção também tem um espectro
A ética da detecção deveria seguir a ética do uso. Se um professor disse aos alunos para escreverem sem IA em uma determinada tarefa, um detector pode fazer parte de um processo de integridade acadêmica. Uma pontuação do Pangram nunca deveria ser a única evidência, especialmente diante do que está em jogo para os alunos.
Os concursos criativos enfrentam um problema semelhante. O argumento de Piper sobre o Commonwealth Short Story Prize deve ser levado a sério porque os prêmios de ficção têm a ver, em parte, com o ofício humano. Se um prêmio recompensa a voz de um escritor humano, uma submissão totalmente gerada por IA viola a premissa. O organizador pode permitir a IA, proibi-la ou criar uma categoria separada. A confiança sozinha não resolverá o problema.
A revisão por pares é mais difícil. Seth Lazar apresentou a versão mais forte do argumento pró-detecção em resposta ao meu post anterior sobre o Pangram: a produção de pesquisa gerada por IA pode se tornar um ataque de negação de serviço à revisão por pares. O custo de produzir artigos com aparência plausível despenca, enquanto a obrigação de lê-los continua cara. Nesse contexto, um detector pode ajudar a preservar a escassa capacidade de revisão.
O caso da revisão por pares ainda depende do objetivo. Se o objetivo é flagrar alunos que violam uma regra explícita, a procedência é o alvo. Se o objetivo é proteger os revisores de submissões sem valor, a procedência é apenas um indicador indireto: um detector estima a probabilidade de um texto ser de IA, nunca a probabilidade de ele ser ruim. O verdadeiro alvo é o trabalho ruim: dados alucinados, citações falsas, métodos inexistentes e artigos sem nenhuma pergunta digna de resposta. Um detector pode ajudar a triar parte disso, mas alguém ainda precisa verificar as afirmações de fato.
Minha preocupação é que vamos policiar os travessões enquanto ignoramos os dados alucinados por baixo deles. Essa seria uma maneira muito acadêmica de perder o fio da meada: atenção minuciosa ao marcador de superfície, pouca atenção a se a coisa diz algo verdadeiro.
Por que a divulgação quase sempre fracassa
O compromisso óbvio é a divulgação. Deixe as pessoas usarem a IA, exija que digam que a usaram e deixe os leitores decidirem o quanto isso importa. Isso parece atraente porque trata a assistência de IA como informação e baixa a temperatura moral.
Argumentei na Parte II da série sobre IA que as normas de divulgação desmoronam sob os incentivos que criam. A metade do argumento referente ao detector agora precisa de revisão, porque o Pangram parece funcionar muito melhor do que eu esperava. A metade referente à divulgação ainda me parece correta.
Quanto mais eticamente questionável é o uso da IA, mais forte é o incentivo para escondê-lo. Um aluno que usou IA depois de prometer escrever sem ajuda, um participante de concurso que submeteu ficção escrita por máquina a um prêmio de escrita humana, ou um pesquisador que usou IA para mascarar citações falsas têm todos os motivos para permanecer calados.
As pessoas mais propensas a divulgar são as que usam IA de maneiras de baixo risco: limpando um parágrafo, traduzindo um gráfico ou transformando anotações soltas em prosa legível que continua sendo delas. Esses são também os casos em que a divulgação menos importa. O equilíbrio provável é um mundo cheio de reconhecimentos rituais sobre assistência de IA inofensiva, enquanto os casos genuinamente enganosos permanecem ocultos até que alguém os investigue.
A divulgação ainda pode ajudar quando a própria divulgação explica o trabalho, como acontece aqui. Editores, professores, comitês de prêmios e pessoas que exercem autoridade institucional também deveriam deixar claras as regras que aplicam. Mas se todo o sistema depende de uma confissão honesta, ele punirá os conscienciosos e deixará em paz os usuários estratégicos.
O novo policiamento gramatical
Sei que a expressão “nazismo gramatical” é áspera, e quero dizer algo específico com ela. Nasci na União Soviética, e a cultura de elite russa pode ser intensamente sensível à gramática, à pronúncia, aos padrões de acentuação e aos pequenos marcadores de status embutidos na fala. Na prática, a correção gramatical muitas vezes funcionava também como triagem social: a escola errada, a região errada, a origem familiar errada ou o tipo errado de educação podiam transparecer no modo como você falava.
Os Estados Unidos têm sua própria versão disso. O inglês acadêmico está repleto de sinais de status disfarçados de padrões. O tipo certo de fluência faz você parecer inteligente antes que alguém verifique se você tem razão, e o sotaque ou a expressão errados podem rotulá-lo como pouco sério antes que seu argumento seja ouvido.
A detecção de IA está transformando esse velho hábito em um novo ritual técnico. As mesmas pessoas que antes policiavam a gramática agora policiam os “sinais de IA”: travessões, transições suaves, metáforas genéricas, parágrafos estranhamente equilibrados, uma prosa que parece um pouco limpa demais. Às vezes elas têm razão. A escrita de IA de fato tem padrões reconhecíveis, e é por isso que tenho um guia de estilo cheio deles.
Se alguém lê um texto, aprende algo novo e então transforma a conversa em uma única expressão suspeita, o instinto Pangramatical desperdiçou o tempo de todo mundo. A atenção do leitor deveria ir primeiro para a afirmação, a evidência e a recompensa, deixando o policiamento de estilo para os casos em que a prosa de fato bloqueia a compreensão ou sinaliza engano.
Essa dinâmica de status é muito familiar. A pontuação do detector dá uma licença de aparência científica para descartar um trabalho sem lê-lo com cuidado. Quem se beneficia costumam ser os escritores estabelecidos e os guardiões credenciados que conseguem transformar uma decisão de julgamento em uma pontuação. A acusação se torna especialmente conveniente contra escritores de status mais baixo e pessoas que não escrevem bem em inglês, mas agora podem usar a IA para traduzir, redigir e alcançar um público de língua inglesa. Polido demais parece falso. Desajeitado demais parece de baixa qualidade. De qualquer forma, o guardião vence.
A lógica da contaminação moral piora o problema. Quando o envolvimento da IA é tratado como impureza, qualquer vestígio de assistência basta para condenar o trabalho inteiro. Esse é um padrão estranho para um mundo em que a escrita humana sempre foi socialmente produzida por editores, revisores, coautores, tradutores e a frase que você leu ontem.
O equilíbrio mais engraçado possível já está aqui. As ferramentas de IA escrevem uma prosa clara demais, os detectores punem a clareza e, então, novas ferramentas “humanizadoras” reescrevem a prosa para que pareça mais desajeitada. A TIME descreveu recentemente pessoas inserindo erros e esquisitices para evitar soar como geradas por IA. Isto é o Grammarly ao contrário: deixar a escrita pior para que pareça mais autêntica.
O que fazer em vez disso
Estou defendendo a modéstia dos detectores. O Pangram só deveria ser usado onde a procedência faz parte do acordo: provas com regras explícitas de “sem IA”, concursos que prometem ofício humano ou contextos institucionais em que a origem do texto faz parte do trabalho. A regra institucional deveria ser escrita antes de a pontuação ser consultada: definir qual uso de IA violaria a promessa e qual processo de recurso se segue a uma pontuação alta.
Em muitos domínios, o padrão deveria ser bastante simples: se você põe seu nome no trabalho, você responde por ele. Você responde pelos fatos, pelas afirmações, pelos erros, pelo gosto, pela estrutura e pelo julgamento. Se a IA o ajudou a produzir um resumo técnico preciso, ótimo. Se a IA o ajudou a produzir bobagem mais depressa, isso é por sua conta.
Como a atenção é escassa, as pessoas continuarão a recorrer a atalhos. Vão confiar em nomes que conhecem, periódicos que respeitam, editores com histórico, amigos que leram o trabalho e instituições que têm algo a perder se publicarem lixo. Isso é imperfeito e muitas vezes injusto. Forasteiros e recém-chegados pagam um preço quando a reputação se torna o filtro. Mas pelo menos a reputação é responsabilizável ao longo do tempo. Se um periódico, um prêmio, um professor ou um escritor continua endossando trabalhos ruins, as pessoas podem perceber.
Uma pontuação do Pangram é diferente. Ela dá um palpite rápido sobre a procedência textual e nos convida a parar de ler antes de perguntar o que o texto está fazendo. O Pangram parece funcionar, então a questão não é mais se conseguimos detectar a IA. A questão é o que devemos fazer com essa informação. Use-a quando a procedência faz parte do trato e o que está em jogo justifica uma investigação. Trate-a como um estímulo ao julgamento, nunca como um substituto do julgamento.
Se o trabalho é falso, errado, plagiado, emocionalmente fraudulento ou uma violação de uma regra clara, diga isso e aja em conformidade. Se o trabalho é preciso, útil e assumido pela pessoa cujo nome está nele, o fato de o Codex, o Claude ou o ChatGPT terem ajudado a montar as frases é uma base fraca para um escândalo. O escândalo seria construir uma cultura em que todos aprendem a deixar a escrita pior para que ela possa passar por humana.
Uma última divulgação, já que todo o texto é sobre essa questão: o ensaio acima foi escrito inteiramente no Codex a partir de várias horas de pensamentos que ditei, de posts anteriores, de instruções de estilo salvas e de trocas recentes nas redes sociais. A imagem de capa e o gráfico do espectro também foram produzidos pelo Codex. Não foi um prompt único. Passamos por mais de uma dúzia de iterações, refinando principalmente o argumento e o gráfico. Sim, estou usando o Codex mais do que o Claude Code agora. Sim, li o rascunho antes de publicar, mas não editei a prosa frase a frase. Pelo meu próprio gráfico, este ensaio fica do lado do espectro em que o conteúdo é o que importa, e eu respondo por ele.
