Modelos de pesos abiertos vs código abierto: la diferencia real
"Los dos términos se usan como sinónimos y no lo son. Lo que puedes descargar, inspeccionar y reutilizar difiere mucho, y afecta a lo que tienes permitido hacer."
"Abierto" es una de las palabras más sobrecargadas en el mundo de los modelos. A un modelo lo llaman "abierto" y la gente asume que significa lo que "código abierto" ha significado en el software durante décadas: puedes ver todo, cambiar cualquier cosa y reutilizarlo libremente. Con los modelos, esa suposición suele estar equivocada. La mayoría de los modelos descritos como abiertos son de pesos abiertos, que es algo más estrecho y específico que el código abierto, y la brecha entre los dos términos decide lo que realmente tienes permitido y puedes hacer. Tratarlos como sinónimos lleva a expectativas erróneas sobre la transparencia, la reproducibilidad y tus derechos legales.
Este artículo desenreda los dos. Explica de qué está hecho un modelo, qué libera realmente cada uno de los términos "pesos abiertos" y "código abierto", por qué la distinción importa en la práctica y cómo leer la letra pequeña antes de comprometerte.
De qué está hecho realmente un modelo
Para ver la diferencia, hay que ver los ingredientes de un modelo. Son varios, y la "apertura" puede aplicarse a cualquier subconjunto de ellos.
Los pesos son los parámetros aprendidos: la gigantesca colección de números a la que el modelo llegó mediante el entrenamiento. Son lo que cargas para ejecutar el modelo de verdad. La arquitectura es el diseño de la red: cómo está estructurada y cómo fluyen los datos por ella. El código de entrenamiento es el software usado para entrenarlo. Los datos de entrenamiento son el corpus del que aprendió. Y la receta de entrenamiento es todo lo demás: la configuración, los procedimientos, las decisiones que marcaron la diferencia entre un modelo mediocre y uno bueno.
El punto crucial es que liberar los pesos no libera el resto. Puedes entregarle a alguien los números terminados sin entregar los datos, el código ni la receta que los produjeron. Esa separabilidad es exactamente lo que los dos términos reparten de forma distinta.
Qué significa "pesos abiertos"
Un modelo de pesos abiertos es aquel cuyos pesos se ponen a disposición para descargar y ejecutar. Obtienes el modelo terminado —los números— y puedes cargarlo, ejecutarlo en tu propio hardware y usarlo en tus productos sujeto a su licencia. Esto es genuinamente valioso: significa que no quedas atado a los servidores de un solo proveedor, puedes ejecutar el modelo de forma privada y puedes construir sobre él sin pedir permiso para cada uso.
Pero los pesos abiertos normalmente se detienen en los pesos. Por lo general no obtienes los datos de entrenamiento, a menudo no obtienes el código de entrenamiento completo y rara vez obtienes la receta completa. Así que puedes usar el modelo, pero no puedes reproducirlo desde cero, no puedes auditar plenamente cómo llegó a existir y no puedes verificar de forma independiente qué entró en él. Tienes el artefacto, no la fábrica que lo hizo. Para la mayoría de los usos prácticos eso basta; para la transparencia, la reproducibilidad o una confianza profunda, no.
Qué significa "código abierto"
"Código abierto", en sentido estricto, fija un listón más alto heredado del software. El significado establecido de código abierto no es solo "puedes mirarlo": es un conjunto de libertades: usar la cosa para cualquier propósito, estudiar cómo funciona, modificarla y redistribuirla, incluidas las versiones modificadas, sin condiciones restrictivas. Aplicado con honestidad a un modelo, eso implica liberar suficientes ingredientes para que otra persona pudiera realmente estudiarlo, reconstruirlo y adaptarlo, no solo ejecutar los pesos terminados.
Esta es una afirmación significativamente más fuerte que la de pesos abiertos, y es más rara. Muchas cosas comercializadas como "modelos de código abierto" liberan solo los pesos bajo una licencia que restringe cómo puedes usarlos, lo que incumple la definición más estricta en dos puntos: ingredientes incompletos y términos restrictivos. La palabra carga con el prestigio de décadas de software de código abierto, que es precisamente por lo que se aplica con ligereza a modelos que no lo merecen.
Por qué la distinción no es pedantería
Esto importa porque los dos términos crean derechos distintos y capacidades distintas, y confundirlos te expone a tres problemas concretos.
Primero, derechos legales. La licencia de un modelo rige lo que realmente puedes hacer: si puedes usarlo comercialmente, construir un producto competidor, redistribuirlo o usarlo por encima de cierta escala. La palabra "abierto" en el marketing no te dice nada de esto; la licencia sí. Un modelo puede ser de descarga libre y aun así venir con restricciones que descartan tu uso previsto.
Segundo, transparencia y confianza. Si necesitas saber con qué datos aprendió un modelo —para cumplimiento, para revisión de sesgos, para entender los modos de fallo— los pesos abiertos por sí solos no te lo darán. Solo una divulgación más completa de los datos y la receta respalda ese tipo de escrutinio. Asumir que "abierto" significa "inspeccionable hasta el fondo" te deja sin poder responder preguntas que quizá estés obligado a responder.
Tercero, reproducibilidad. Si tu trabajo requiere poder reentrenar, verificar o reconstruir el modelo a partir de sus ingredientes —algo común en investigación y en entornos regulados— los pesos por sí solos no bastan. Necesitas el código, los datos y la receta. Esperar reproducir un modelo de pesos abiertos y descubrir que no puedes es una sorpresa costosa de tener tarde.
Cómo leer la letra pequeña
Como las etiquetas no son fiables, juzga un modelo por sus términos reales en lugar de por su adjetivo. Unas pocas preguntas atraviesan el marketing.
Pregunta qué se liberó realmente. ¿Solo los pesos? ¿También el código de entrenamiento? ¿Alguna información sobre los datos? ¿Los detalles de la arquitectura? La respuesta ubica al modelo en el espectro mucho mejor que la palabra "abierto".
Pregunta qué permite y qué prohíbe la licencia. Léela en busca de uso comercial, redistribución, modificación, límites de escala y cualquier restricción por campo de uso. Esta es la parte con fuerza legal, y es donde los modelos vagamente etiquetados como "abiertos" más a menudo decepcionan.
Pregunta qué necesitas realmente. Si solo necesitas ejecutar un modelo capaz de forma privada y lanzar un producto, los pesos abiertos bajo una licencia suficientemente permisiva pueden ser exactamente lo correcto y las preguntas más profundas resultan irrelevantes. Si necesitas auditar, reproducir o redistribuir libremente, necesitas más, y debes confirmar que lo tienes en lugar de asumirlo.
Un espectro, no dos cajas
Ayuda abandonar el binario por completo. La apertura es un espectro que va desde un modelo que solo puedes invocar a través de la API de otro, pasando por un modelo de pesos abiertos descargable bajo una licencia restrictiva, a un modelo de pesos abiertos con licencia permisiva, a un modelo que además divulga el código y los datos, hasta uno que libera la lista completa de ingredientes bajo términos genuinamente libres. Cada paso otorga más libertad y más transparencia. La única palabra "abierto" colapsa todo este rango en una sola sílaba, que es exactamente por lo que confunde. Ubica un modelo en el espectro y sabrás qué estás obteniendo.
En resumen
Pesos abiertos y código abierto no son sinónimos. Pesos abiertos significa que puedes descargar y ejecutar los pesos terminados —útil, pero normalmente se detiene ahí, dejando atrás los datos, el código y la receta. Código abierto, usado correctamente, significa un conjunto más completo de libertades e ingredientes, y es más raro de lo que sugiere el marketing. La distinción rige tus derechos legales, tu capacidad de inspeccionar y tu capacidad de reproducir. Ignora el adjetivo, lee la licencia y las notas de lanzamiento, y compara lo que realmente se proporcionó con lo que tu proyecto genuinamente necesita. La palabra "abierto" es una pregunta de partida, nunca la respuesta.
