Detector de texto AI
Analiza cualquier texto para detectar si ha sido escrito por la IA o por un humano.
Listo para analizar
Pegue cualquier texto y haga clic en "Analizar" para detectar contenidos generados por IA.
Detector de IA gratuito
Copyleaks marcó un párrafo que escribí yo mismo el martes pasado. Cien por cien IA, decía. Primero lo escribí a mano en un cuaderno, luego lo mecanografié y, por lo visto, ahora mi estilo de mecanografía limpia no se distingue de la salida de GPT-4. Ejecuta el detector de IA anterior en cualquier texto del que tengas sospechas: pégalo, pulsa Analizar y obtendrás un desglose en un par de segundos sin que nada salga de tu máquina.
Esta experiencia resume en gran medida la situación de la detección de IA en 2025. Las herramientas que eran “95% precisas” hace dos años ahora están luchando con cualquier cosa que haya sido ligeramente editada, y las que capturan la salida ChatGPT cruda todavía se ahogan con Claude o Gemini porque cada modelo tiene diferentes huellas dactilares estadísticas. He probado probablemente una docena de estas cosas en el último año - Originality.ai, ZeroGPT, GPTZero, la integración de Turnitin, Copyleaks, Winston AI - y el problema de los falsos positivos no ha mejorado. Ha empeorado, sobre todo porque los propios modelos han mejorado en la imitación de estructuras de frases variadas.

Qué mide realmente un detector de IA
La mayoría de la gente cree que estas herramientas buscan “frases de IA”, cosas como “es importante señalar” o “en conclusión”. Algunas de las primeras funcionaban así, básicamente comparando patrones con una lista de GPT-ismos muy utilizados. Pero ese enfoque se vino abajo en cuanto se empezó a pedir a los modelos que escribieran de forma casual o con determinadas voces.
Los detectores más serios utilizan las puntuaciones de perplejidad y explosividad. La perplejidad mide lo predecible que es cada palabra teniendo en cuenta las palabras que la preceden. El texto de la IA tiende a tener una perplejidad BAJA: cada palabra es el siguiente token estadísticamente “esperado” porque así es literalmente como el modelo genera el texto. La escritura humana es más desordenada, más sorprendente, con una perplejidad media más alta, porque elegimos palabras raras, empezamos las frases de formas inusuales y a veces elegimos la tercera mejor palabra porque nos suena mejor aunque sea menos “lógica”.”
La ráfaga consiste en variar esa previsibilidad. Los humanos escriben en ráfagas: una frase muy predecible seguida de otra extraña, un largo pasaje técnico seguido de un inciso de tres palabras. El texto de la IA es más uniforme, lo cual es irónico, ya que los nuevos modelos se han ajustado específicamente para variar más su producción. Pero incluso Claude y GPT-4o siguen agrupándose en una banda estadística más estrecha que los escritores humanos reales, al menos en pasajes de más de 300 palabras. Por debajo de esa longitud, sinceramente, el detector de nadie es fiable. Por eso esta herramienta pide un número mínimo de palabras: está siendo honesta con las matemáticas en lugar de darte una respuesta errónea segura sobre una entrada de dos frases.
El problema de los falsos positivos del que nadie habla
Esto es lo que me molesta de la mayoría de las herramientas de detección de IA del mercado: informan de las puntuaciones de confianza como si fueran definitivas. “98.7% generado por IA.” Suena preciso. Suena fiable. Excepto que he visto el mismo párrafo de Hemingway con una puntuación de entre 40% y 95% de IA en diferentes herramientas probadas el mismo día. The Old Man and the Sea aparentemente se lee como ChatGPT para la mitad de estos algoritmos.
Los angloparlantes no nativos son los más afectados. Trabajo con escritores de Europa del Este y el Sudeste Asiático, y su inglés - gramaticalmente correcto pero con estructuras de frases más sencillas y menos expresiones idiomáticas - es marcado sistemáticamente como generado por la IA. Un amigo mío que escribe contenidos SEO en inglés, su tercer idioma, ha renunciado básicamente a enviar contenidos a clientes que realizan comprobaciones de IA, porque su estilo de escritura natural activa todos los detectores que existen. No es un caso aislado. Hay millones de personas que escriben inglés profesional como segunda lengua, y las herramientas de detección están esencialmente sesgadas contra ellos porque su escritura se asemeja al patrón “limpio y predecible” que producen los modelos.
El detector de esta página se ejecuta completamente en el navegador, lo que significa que tu texto no se envía a ningún servidor ni se almacena en ningún sitio. Yo dejé de utilizar un par de detectores basados en la nube después de leer más detenidamente sus políticas de privacidad y darme cuenta de que los textos enviados podían utilizarse para el entrenamiento de modelos. No todos lo hacen, pero sí los suficientes como para que merezca la pena pensárselo.
Cuando los resultados de la detección de IA realmente importan
Si eres editor o profesor, un detector de ai es un punto de partida para una conversación, no un veredicto. La puntuación te dice “este texto tiene propiedades estadísticas consistentes con la generación automática”. No te dice si alguien usó IA para redactar y luego editó mucho, si usó IA para traducir y luego reescribió, o si simplemente resulta que escribe una prosa limpia y predecible.
He empezado a tratar las puntuaciones de detección como trato las sugerencias gramaticales de un corrector ortográfico: señal útil, a menudo errónea en lo específico, nunca la última palabra. Lo más útil que puede hacer un detector de errores es señalar los pasajes que parecen inusualmente uniformes en sus puntuaciones de perplejidad, de modo que puedas examinar esas secciones específicamente y emitir un juicio humano. Si lo que quieres es comprobar si lo que escribes puede ser marcado antes de enviarlo a algún sitio, la herramienta anterior te avisa sin que tengas que registrarte ni compartir datos. Si necesitas comprobar contenidos de audio o vídeo para generar inteligencia artificial, el problema es totalmente distinto: la detección basada en texto no es válida para todas las modalidades.
La tecnología seguirá evolucionando en ambos sentidos. La marca de agua es probablemente la solución a largo plazo: el SynthID de Google y otros enfoques similares incorporan firmas estadísticas durante la generación que los detectores pueden buscar sin depender del análisis estilístico. Pero hasta que eso sea estándar en todos los modelos y plataformas, la detección basada en la perplejidad es lo que tenemos, y funciona mejor de lo que la gente cree, siempre que no se trate el resultado como un evangelio.
PREGUNTAS FRECUENTES
¿Cuál será la precisión de los detectores de IA en 2025?
La precisión varía significativamente en función del modelo que generó el texto y del grado de edición posterior. La mayoría de los detectores decentes alcanzan una precisión de 85-92% con texto ChatGPT sin editar. En textos editados de IA o de modelos más recientes como Claude o Gemini, la precisión cae a 60-75% en pruebas independientes. Ningún detector es fiable en pasajes de menos de 250-300 palabras.
¿Pueden los detectores de IA decir qué modelo escribió el texto?
La mayoría no puede. Unas pocas herramientas comerciales afirman atribuir modelos, pero los resultados no son lo bastante coherentes como para confiar en ellos. Los distintos modelos tienen patrones de distribución de tokens sutilmente diferentes, pero esos patrones se solapan lo suficiente como para que distinguir GPT-4 de Claude de Gemini siga siendo más conjetura que ciencia en este momento.
¿Por qué mi texto escrito por humanos se marca como AI?
Los falsos positivos se producen cuando su estilo de escritura se ajusta a los patrones habituales en los resultados de la IA: gramática limpia, elección de palabras predecible, longitud coherente de las frases. Los más afectados son los hablantes de inglés no nativos, los redactores técnicos y las personas que escriben de manera formal. Editar tu texto para añadir estructuras de frases más variadas y opciones de palabras menos predecibles puede ayudar, aunque no deberías tener que cambiar tu forma de escribir para satisfacer a un algoritmo imperfecto.
¿Cuál es la diferencia entre perplejidad y explosividad en la detección de IA?
La perplejidad mide lo sorprendente que resulta cada palabra dado el contexto que la rodea: una perplejidad baja significa un texto muy predecible. La explosividad mide la variación de esa previsibilidad a lo largo de todo el pasaje. El texto humano suele mostrar tanto una mayor perplejidad media como oscilaciones de explosividad más amplias que el texto generado por IA, que tiende a mantenerse en una banda estadística más estrecha incluso cuando se le pide que escriba de forma casual.
¿Sustituirá la IA a las herramientas de detección?
Probablemente, con el tiempo. El proyecto SynthID de Google y otros similares incorporan patrones estadísticos invisibles durante la generación del texto que pueden detectarse más tarde sin depender del análisis estilístico. El reto es la adopción: hasta que todos los grandes modelos no incorporen marcas de agua por defecto y éstas sobrevivan al copia-pega y la edición, la detección estilística seguirá siendo necesaria. La mayoría de los investigadores creen que aún faltan 2-3 años para que la marca de agua esté lo suficientemente extendida como para ser importante.