100% Offline - Privacidade em primeiro lugar

Detetor de texto com IA

Analise qualquer texto para detetar se foi escrito por uma IA ou por um humano.

Pronto para analisar

Cole qualquer texto e clique em "Analisar" para detetar conteúdo gerado por IA

Detetor de IA gratuito

O Copyleaks assinalou um parágrafo que eu próprio escrevi na passada terça-feira. Cem por cento IA, dizia. Escrevi-o à mão num bloco de notas, depois escrevi-o à máquina e, aparentemente, o meu estilo de escrita limpo é indistinguível do texto GPT-4. Corre o detetor de IA acima em qualquer texto de que tenhas suspeitas - cola-o, carrega em Analisar e terás uma análise em poucos segundos sem que nada saia da tua máquina.

Esta experiência resume bem a situação em que nos encontramos no que respeita à deteção de IA em 2025. As ferramentas que eram “95% precisas” há dois anos estão agora a lutar com qualquer coisa que tenha sido ligeiramente editada, e as que captam a saída bruta do ChatGPT ainda engasgam com Claude ou Gemini porque cada modelo tem impressões digitais estatísticas diferentes. Testei provavelmente uma dúzia destas coisas no último ano - Originality.ai, ZeroGPT, GPTZero, a integração Turnitin, Copyleaks, Winston AI - e o problema dos falsos positivos não melhorou. Piorou, principalmente porque os próprios modelos melhoraram na imitação de estruturas de frases variadas.

Detetor de IA gratuito

O que mede realmente um detetor de IA

A maioria das pessoas pensa que estas ferramentas procuram “frases de IA” - coisas como “é importante notar” ou “em conclusão”. Algumas das primeiras ferramentas funcionavam de facto dessa forma, basicamente fazendo a correspondência de padrões com uma lista de frases GPT demasiado usadas. Mas essa abordagem caiu por terra no momento em que as pessoas começaram a pedir aos modelos que escrevessem casualmente ou em vozes específicas.

Os detectores mais sérios utilizam a pontuação de perplexidade e de rutura. A perplexidade mede o grau de previsibilidade de cada palavra, tendo em conta as palavras que a precedem. O texto da IA tende a ser de baixa perplexidade - cada palavra é o próximo token estatisticamente “esperado” porque é literalmente assim que o modelo gera o texto. A escrita humana é mais confusa, mais surpreendente, com maior perplexidade em média, porque fazemos escolhas de palavras estranhas, começamos frases de formas invulgares e, por vezes, escolhemos a terceira melhor palavra porque nos soa melhor, apesar de ser menos “lógica”.”

A explosão tem a ver com a variação dessa previsibilidade. Os humanos escrevem em rajadas - uma frase muito previsível seguida de uma frase estranha, uma longa passagem técnica seguida de um aparte de três palavras. O texto da IA tem uma explosão mais uniforme, o que é um pouco irónico, uma vez que os modelos mais recentes foram especificamente ajustados para variar mais a sua produção. Mas mesmo o Claude e o GPT-4o ainda se agrupam numa faixa estatística mais estreita do que os escritores humanos reais, pelo menos em passagens com mais de 300 palavras. Abaixo desse tamanho, honestamente, o detetor de ninguém é fiável. É por isso que esta ferramenta pede uma contagem mínima de palavras - está a ser honesta em relação à matemática, em vez de lhe dar uma resposta errada com base numa entrada de duas frases.

O problema dos falsos positivos de que ninguém fala

Eis o que me incomoda na maioria das ferramentas de deteção de IA existentes no mercado: comunicam os resultados de confiança como se fossem definitivos. “98.7% gerado por IA.” Parece preciso. Parece fiável. Exceto que já vi o mesmo parágrafo de Hemingway ter uma pontuação de 40% a 95% de IA em diferentes ferramentas testadas no mesmo dia. O Velho e o Mar parece ler-se como ChatGPT para metade destes algoritmos.

Os falantes não nativos de inglês são os mais afectados. Trabalho com escritores da Europa de Leste e do Sudeste Asiático e o seu inglês - gramaticalmente correto, mas com estruturas frásicas mais simples e frases menos idiomáticas - é constantemente assinalado como sendo gerado por IA. Um amigo meu, que escreve conteúdos SEO em inglês como terceira língua, desistiu basicamente de submeter os seus conteúdos a clientes que efectuam verificações de IA, porque o seu estilo de escrita natural desencadeia todos os detectores existentes. Não se trata de um caso isolado de um nicho. Há milhões de pessoas que escrevem inglês profissional como segunda língua, e as ferramentas de deteção são essencialmente tendenciosas contra elas porque a sua escrita se assemelha ao padrão “limpo e previsível” que os modelos produzem.

O detetor nesta página funciona inteiramente no browser, o que significa que o seu texto não é enviado para nenhum servidor nem armazenado em lado nenhum. Isto é importante se estiver a verificar o trabalho de um cliente ou documentos internos - deixei de utilizar alguns dos detectores baseados na nuvem depois de ler as suas políticas de privacidade com mais atenção e de me aperceber que os textos enviados poderiam ser utilizados para o treino de modelos. Nem todos fazem isto, mas há muitos que o fazem, pelo que vale a pena refletir sobre o assunto.

Quando os resultados da deteção de IA são realmente importantes

Se for um editor ou um professor, um detetor de IA é um ponto de partida para uma conversa, não um veredito. A pontuação diz-lhe que “este texto tem propriedades estatísticas consistentes com a geração automática”. Não nos diz se alguém utilizou IA para fazer um rascunho e depois o editou fortemente, se utilizou IA para traduzir e depois reescreveu, ou se simplesmente escreve prosa limpa e previsível.

Comecei a tratar as pontuações de deteção da mesma forma que trato as sugestões gramaticais de um corretor ortográfico - um sinal útil, muitas vezes errado nos aspectos específicos, nunca a palavra final. A coisa mais útil que um detetor de IA pode fazer é assinalar passagens que parecem invulgarmente uniformes nas suas pontuações de perplexidade, para que possa olhar para essas secções especificamente e fazer um julgamento humano. Se estiver a tentar verificar se a sua própria escrita pode ser sinalizada antes de a enviar para algum lado, a ferramenta acima dá-lhe esse aviso sem qualquer registo ou partilha de dados. Se precisar de testar conteúdos de áudio ou vídeo para a geração de IA, o problema é completamente diferente - a deteção baseada em texto não atravessa modalidades.

A tecnologia continuará a evoluir em ambos os lados. A marca de água é provavelmente a solução a longo prazo - o SynthID da Google e abordagens semelhantes incorporam assinaturas estatísticas durante a geração que os detectores podem procurar sem depender da análise estilística. Mas até que isso seja uma norma em todos os modelos e plataformas, a deteção baseada na perplexidade é o que temos, e funciona melhor do que as pessoas lhe dão crédito, desde que não se trate o resultado como um evangelho.

FAQ

Qual será a precisão dos detectores de IA em 2025?

A precisão varia significativamente consoante o modelo que gerou o texto e a quantidade de edição efectuada posteriormente. No texto bruto e não editado do ChatGPT, a maioria dos detectores decentes atinge uma precisão de 85-92%. Em texto AI editado ou texto de modelos mais recentes como Claude ou Gemini, a precisão cai para 60-75% em testes independentes. Nenhum detetor é fiável em passagens com menos de 250-300 palavras.

Os detectores de IA podem dizer qual o modelo que escreveu o texto?

A maioria não consegue. Algumas ferramentas comerciais reivindicam a atribuição de modelos, mas os resultados não são suficientemente consistentes para se poder confiar neles. Diferentes modelos têm padrões de distribuição de tokens subtilmente diferentes, mas esses padrões sobrepõem-se o suficiente para que distinguir o GPT-4 do Claude do Gemini seja, nesta altura, mais adivinhação do que ciência.

Porque é que o meu texto escrito por humanos é assinalado como IA?

Os falsos positivos ocorrem quando o seu estilo de escrita se alinha com padrões comuns nos resultados da IA - gramática clara, escolhas de palavras previsíveis, comprimento consistente das frases. Os falantes não nativos de inglês, os redactores técnicos e as pessoas que escrevem formalmente são os mais afectados. Editar o seu texto para adicionar estruturas de frases mais variadas e escolhas de palavras menos previsíveis pode ajudar, embora não deva ter de alterar a forma como escreve para satisfazer um algoritmo imperfeito.

Qual é a diferença entre perplexidade e rutura na deteção de IA?

A perplexidade mede o grau de surpresa de cada palavra, tendo em conta o contexto envolvente - uma perplexidade baixa significa um texto altamente previsível. A explosão mede a variação dessa previsibilidade ao longo de toda a passagem. O texto humano apresenta, normalmente, uma perplexidade média mais elevada e oscilações mais amplas de rebentação do que o texto gerado por IA, que tende a manter-se numa faixa estatística mais estreita, mesmo quando lhe é pedido que escreva casualmente.

A marca de água com IA irá substituir as ferramentas de deteção?

Provavelmente, eventualmente. O SynthID da Google e projectos semelhantes incorporam padrões estatísticos invisíveis durante a geração de texto que podem ser detectados mais tarde sem depender da análise estilística. O desafio é a adoção - até que todos os grandes modelos incorporem marcas de água por defeito e essas marcas de água sobrevivam ao copiar-colar e à edição, a deteção estilística continua a ser necessária. A maioria dos investigadores pensa que faltam 2 a 3 anos para que as marcas de água se generalizem o suficiente para serem importantes.