Marcar y detectar contenido generado por IA

¿Se puede marcar o detectar con fiabilidad el contenido generado por IA? Una mirada clara a cómo funcionan la marca de agua y la detección.

policy2026-06-03 15:52 KST·Editor jefe·7 min

A medida que el texto, las imágenes, el audio y el vídeo generados por IA se vuelven más difíciles de distinguir del contenido hecho por humanos, surge una pregunta obvia: ¿podemos marcar lo que es de IA para que la gente lo sepa, o detectarlo a posteriori? La esperanza es una solución técnica limpia: un sello o un escáner que separe de forma fiable lo sintético de lo real. La realidad es más matizada y más interesante. La marca de agua y la detección son útiles, mejoran activamente y son fundamentalmente limitadas de maneras que conviene entender antes de que nadie las trate como una solución. Esta es una mirada lúcida a cómo funcionan y dónde fallan.

Dos problemas distintos: marcar y detectar

Ayuda separar dos objetivos que a menudo se confunden.

Marcar (watermarking) significa incrustar deliberadamente una señal dentro del contenido en el momento en que se genera, para que más tarde pueda reconocerse como hecho por IA. Es proactivo: la marca se añade a propósito, por el sistema que creó el contenido.

Detectar significa analizar el contenido a posteriori, sin marca incrustada, e intentar juzgar si fue generado por IA a partir de sus propiedades estadísticas. Es reactivo: una conjetura sobre el origen a partir del contenido solo.

Estos enfrentan dificultades muy distintas. La marca de agua trata de si una marca sobrevive. La detección trata de si una conjetura es fiable. Mezclarlos lleva a expectativas confusas, porque lo segundo es mucho más difícil que lo primero.

Cómo funciona la marca de agua, en principio

Una buena marca de agua incrusta una señal difícil de notar para una persona pero detectable por una máquina que sabe qué buscar. En imágenes o audio, esto puede significar patrones sutiles y estructurados entretejidos en el contenido. En el texto, puede significar empujar el proceso de generación hacia elecciones estadísticamente detectables entre las muchas maneras de formular la misma idea.

La propiedad definitoria de una marca de agua útil es la robustez: debería sobrevivir al manejo ordinario como el redimensionado, la compresión, la edición ligera o el reformateo. Una marca que desaparece en cuanto alguien hace una captura de una imagen o parafrasea un párrafo ofrece poca protección. Gran parte del esfuerzo de investigación se dedica a crear marcas de agua que persistan a través de transformaciones realistas sin dejar de ser invisibles para el público.

Por qué la marca de agua no es una solución completa

Incluso una marca de agua robusta choca con límites estructurales.

Solo marca a los sistemas cooperantes. Una marca de agua existe porque el generador eligió añadirla. Un modelo operado por alguien que elimina la marca, o un sistema construido específicamente para no marcar, produce contenido de IA sin marca. Al honesto se le puede marcar; al decidido no se le puede obligar.
La eliminación y el "lavado" son posibles. Una edición lo bastante agresiva, la regeneración o el paso del contenido por otras herramientas pueden debilitar o eliminar una marca. Existe una pugna continua entre marcar y eliminar.
La ausencia no prueba nada. La limitación más profunda: la presencia de una marca de agua puede sugerir origen en IA, pero su ausencia no prueba origen humano. El contenido sin marca podría estar hecho por humanos, o podría ser contenido de IA que nunca se marcó o al que se le eliminó la marca.

Ese último punto es el que más se pasa por alto. La marca de agua puede ofrecer evidencia positiva de origen en IA en algunos casos; no puede certificar que algo sea humano.

Por qué la detección es aún más difícil

La detección sin marca de agua —juzgar el origen solo a partir del contenido— es fundamentalmente una conjetura probabilística, y el terreno no deja de moverse. A medida que los modelos mejoran, su salida se parece más al trabajo humano, así que las señales estadísticas en las que se apoyan los detectores se vuelven más tenues. Un detector afinado para los modelos de hoy puede ser engañado por los de mañana.

Esto produce dos modos de fallo que ambos causan daño real. Los falsos positivos señalan trabajo humano como de IA, algo dañino cuando se usa para acusar a estudiantes, escritores o candidatos. Los falsos negativos pasan por alto contenido de IA por completo. Como los detectores producen probabilidades, no certezas, tratar sus veredictos como prueba es un error grave. Lo que está en juego es máximo justo donde la detección es menos fiable: las acusaciones de alta consecuencia contra individuos.

Procedencia: un enfoque distinto y más sólido

Una idea más duradera esquiva el juego del gato y el ratón. En lugar de esconder una marca dentro del contenido o adivinar a posteriori, la procedencia adjunta información verificable sobre el origen —cómo se creó y editó una pieza de contenido— que viaja con ella. Piénsalo como un registro a prueba de manipulaciones de dónde vino algo, más que como una señal oculta o una corazonada estadística.

La procedencia desplaza la pregunta de "¿esto parece generado por IA?" a "¿cuál es el historial documentado de este archivo?". No es una cura universal —los registros pueden eliminarse, y el contenido sin procedencia simplemente queda sin verificar en lugar de condenado— pero encaja mejor con cómo funciona realmente la confianza. Rara vez autenticamos las cosas escaneando su sustancia; nos apoyamos en cadenas creíbles de dónde vinieron.

Qué significa esto en la práctica

Juntándolo, se obtiene una postura sobria pero útil:

Trata el marcado y la detección como evidencia, no como prueba. Pueden subir o bajar la confianza; no deberían, por sí solos, decidir acusaciones.
Nunca automatices juicios de alto riesgo basándote en la palabra de un detector. Los falsos positivos arruinan a personas reales. Un humano y evidencia corroborante deben estar en el bucle.
Valora la divulgación y la procedencia por encima de la detección secreta. El etiquetado voluntario y los registros de origen verificables son más sólidos que una carrera armamentística de marcas ocultas.
Espera un objetivo móvil. Cada avance en marcar o detectar invita a un contraataque. No hay una solución final y estable, y las afirmaciones de que existe merecen escepticismo.

Donde el etiquetado o la detección toca consecuencias legales o académicas, los límites anteriores no son tecnicismos: son la diferencia entre la justicia y el daño. Esto es información general, no asesoramiento legal.

En resumen

La marca de agua y la detección son herramientas genuinamente útiles, y no son magia. La marca de agua puede marcar contenido de sistemas cooperantes pero no puede obligar a marcar a los no cooperantes, puede debilitarse con la edición y, crucialmente, no puede probar que algo sea humano. La detección sin marca de agua es una conjetura probabilística que se vuelve menos fiable a medida que los modelos mejoran, con falsos positivos y falsos negativos que conllevan un coste real. La dirección más sólida es la procedencia: registros verificables de origen que viajan con el contenido. Usa todo esto como evidencia, nunca como veredicto, especialmente cuando la reputación o la posición de una persona está en juego. La manera fiable de saber de dónde vino un contenido es, como siempre, una cadena de custodia creíble más que un escáner ingenioso.

#watermarking#detection#provenance#authenticity

Fuentes primarias

NIST