Añade citas a las respuestas de la IA
Las citas convierten una respuesta inverificable en una comprobable. Así se logra que un modelo cite sus fuentes, y que las cite con honestidad.
Una respuesta sin fuente es algo que tienes que creer. Una respuesta con fuente es algo que puedes comprobar. Esa diferencia es todo el valor de las citas: convierten la prosa segura de un modelo en una afirmación que el lector puede rastrear hasta su origen. Esta guía trata de conseguir que un modelo de lenguaje cite las fuentes que respaldan sus respuestas y —algo igual de importante— de lograr que las cite con honestidad en lugar de inventarse referencias verosímiles.
Por qué las citas valen el esfuerzo
Las citas cumplen tres funciones a la vez. Permiten que el lector verifique una afirmación en lugar de aceptarla a ciegas. Generan confianza, porque una respuesta con fuentes indica que el sistema se apoya en material real en vez de improvisar. Y te dan a ti, que construyes el sistema, un mecanismo de detección: una afirmación que el modelo no puede atribuir a una fuente es justamente el tipo de afirmación con más probabilidades de ser inventada. El acto de citar fuerza una comprobación que la generación pura se salta.
Ese último punto es el que la gente subestima. Pedirle a un modelo que cite no es solo una función para el lector: cambia el comportamiento del modelo. Cuando la instrucción es "responde y cita la fuente de cada afirmación", el modelo tiene que encontrar respaldo para lo que dice, y las afirmaciones sin respaldo quedan a la vista. Las citas son un control de calidad integrado en el formato de salida, no una mera cortesía.
Aporta fuentes que el modelo realmente pueda señalar
Un modelo solo puede citar con honestidad si tiene fuentes reales delante para citar. Si le pides que responda a partir de su memoria de entrenamiento y añada citas, producirá citas —y una parte significativa de ellas será inventada, porque está generando referencias verosímiles del mismo modo que genera hechos verosímiles—. La solución es estructural: aporta el material fuente en el prompt y pide al modelo que cite únicamente a partir de ese material.
Dale a cada fuente un identificador estable que el modelo pueda referenciar: un número, una etiqueta breve, un título. Así la cita es un puntero a un material que tú controlas, no una incursión en la memoria del modelo. Cuando la respuesta dice "según la fuente 2", puedes mirar la fuente 2 y confirmarlo. Esta es la base sobre la que descansa todo lo demás: las citas solo son fiables cuando apuntan a un texto aportado, nunca cuando apuntan a un texto recordado.
Pide el formato de cita de forma explícita
Los modelos no adivinan tu estilo de cita preferido; díselo. Decide qué aspecto debe tener una cita en tu salida —un marcador en línea tras cada afirmación, una lista numerada de referencias al final, un fragmento citado con su etiqueta de fuente— y especifícalo con precisión, idealmente con un ejemplo breve. Las instrucciones vagas como "incluye fuentes" producen resultados inconsistentes: a veces una lista, a veces en línea, a veces un gesto impreciso hacia "el documento".
Ajusta el formato a cómo se usará la respuesta. Para una interfaz donde los lectores hacen clic, los marcadores en línea vinculados a una lista de referencias funcionan bien. Para una respuesta que va a auditarse, un fragmento citado junto a cada afirmación hace la verificación inmediata. Elijas lo que elijas, muestra la forma exacta una vez y exige que el modelo la siga en cada afirmación. La consistencia en el formato de cita es lo que hace que las citas sean utilizables más adelante en vez de decorativas.
Vincula cada afirmación con su respaldo, no toda la respuesta a un montón de enlaces
Un patrón débil habitual es una respuesta segura seguida de una bibliografía con todas las fuentes aportadas, sin indicación de qué fuente respalda qué afirmación. Eso no es realmente citar: es un gesto. Le dice al lector que la respuesta está "basada en estos documentos en algún punto" sin permitirle comprobar ninguna afirmación concreta. El sentido de una cita es el vínculo entre una afirmación concreta y el texto concreto que la respalda.
Pide esa granularidad de forma explícita: cada afirmación factual debe llevar su propia cita apuntando a la fuente específica que la respalda. Esto supone más trabajo para el modelo y produce una respuesta más honesta, porque una afirmación que no puede vincularse a ninguna fuente ya no tiene dónde esconderse. Cuando cada afirmación debe nombrar su respaldo, las que no lo tienen destacan: ante el modelo mientras escribe, y ante ti mientras lees.
Gestiona el caso en que no hay respaldo
A veces las fuentes aportadas no contienen la respuesta. Si no lo previenes, el modelo tapará el hueco con una afirmación sin citar o, peor, con una cita inventada que apunta a una fuente que en realidad no dice lo que se afirma. Instruye al modelo sobre qué hacer cuando falta respaldo: que diga que las fuentes no contienen la respuesta, en lugar de inventarse una o citar algo que no respalda la afirmación.
Esto conecta la cita con la honestidad. Un sistema que debe citar cada afirmación, y debe admitir cuándo no puede hacerlo, es uno que solo puede decir cosas que puede respaldar. La vía del "sin respaldo" es lo que impide que el requisito de citar se convierta silenciosamente en un requisito de fabricar: sin ella, un modelo decidido a cumplir el "cita cada afirmación" puede simplemente fabricar las citas que necesita.
Verifica las citas, no te limites a mostrarlas
Una cita que produce el modelo es una afirmación como cualquier otra, y puede ser errónea: apuntar a la fuente correcta por la razón equivocada, o a una fuente que en realidad no contiene el dato citado. Mostrar citas a los lectores sin comprobarlas da una falsa sensación de rigor. Los sistemas más sólidos verifican, al menos de forma programática, que cada fuente citada contiene texto que respalda la afirmación a la que está vinculada.
Esto es factible justamente porque aportaste las fuentes y exigiste citas granulares. Puedes comprobar que existe el ID de la fuente citada, que el fragmento citado aparece en ella, que la afirmación está plausiblemente respaldada por el pasaje citado. Las citas que no superan la comprobación se marcan o se eliminan. El resultado es una canalización en la que una cita significa lo que parece significar, en vez de una decoración que los lectores suponen verificada cuando no lo está.
En resumen
Las citas son la forma en que una respuesta de IA se gana la confianza: permiten comprobar las afirmaciones, indican fundamento y obligan al modelo a encontrar respaldo para lo que dice. Para que sean honestas, dale al modelo fuentes reales a las que apuntar, especifica el formato de cita con exactitud y exige que cada afirmación lleve su propio respaldo en vez de gesticular hacia un montón de enlaces. Prevé el caso en que no hay respaldo para que el requisito no engendre referencias inventadas, y verifica las citas en lugar de mostrarlas a ciegas. Hecho así, una cita deja de ser decoración y se convierte en lo que debería ser: un hilo del que el lector puede tirar para confirmar que la respuesta es real.
