Modelos
Modelos, versiones y contexto de los benchmarks
Embeddings frente a generación: dos cosas que hacen los modelos
"Los embeddings y la generación son trabajos distintos. Saber cuál necesita tu problema es la vía más rápida hacia un sistema que funciona."
El costo de un token: cómo funciona el precio de los modelos
"Las facturas de los modelos se miden en tokens, no en palabras ni solicitudes. Entender qué es un token, y cuáles pagas, mantiene el costo predecible."
Ventanas de contexto explicadas: tokens, atención y dónde se rompe el contexto largo
Una ventana de contexto más grande no es lo mismo que mejor memoria. Aquí está qué es de verdad, por qué se degrada con entradas largas y cómo diseñar.
Qué significa de verdad un "modelo frontera" — y por qué los benchmarks engañan
"Modelo frontera" es una etiqueta móvil, no una ficha técnica. Esto es a lo que apunta, por qué los rankings rara vez sirven y cómo elegir bien igualmente.
Cómo se entrenan los grandes modelos de lenguaje, en lenguaje llano
Entrenar un modelo de lenguaje ocurre por etapas, no en un paso mágico. Qué hace cada etapa, en lenguaje llano, y por qué el orden importa.
Modelos de pesos abiertos vs código abierto: la diferencia real
"Los dos términos se usan como sinónimos y no lo son. Lo que puedes descargar, inspeccionar y reutilizar difiere mucho, y afecta a lo que tienes permitido hacer."
Por qué los modelos tienen cortes de conocimiento
El conocimiento de un modelo se detiene en una fecha porque queda congelado en el entrenamiento. Por qué ocurre y cómo lo sortean las herramientas.
Modelos multimodales: qué significa de verdad "puede ver"
Cuando un modelo "ve" una imagen, no está mirando como tú. Aquí va cómo funcionan de verdad los modelos multimodales, qué habilitan y dónde fallan en silencio.
Tokens y tokenización: por qué los modelos ven el texto de forma extraña
Los modelos no leen letras ni palabras: leen tokens. Entender ese hecho explica los fallos de ortografía, los costes raros y los límites de contexto.
Modelos abiertos frente a cerrados: cómo elegir para un proyecto real
¿Pesos abiertos o una API alojada? La respuesta correcta depende del control, el coste y el riesgo, no de la ideología. Aquí va un marco que sobrevive al contacto con producción.
Modelos de razonamiento: qué hacen los tokens de "pensamiento"
"Los modelos de razonamiento trabajan el problema antes de responder. Ese trabajo oculto cuesta tiempo y tokens, y solo rinde en el tipo de tarea adecuado."
Qué son de verdad los "parámetros" de un modelo
"Miles de millones de parámetros" se cita como si fueran caballos de fuerza. Esto es qué es un parámetro, por qué importa el recuento y por qué más no es mejor.
Cuantización y destilación: hacer los modelos más pequeños
"Dos formas distintas de encoger un modelo: una cambia sus números, la otra entrena una copia más pequeña. Así funciona cada una y cuándo recurrir a ella."
Modelos de mezcla de expertos, explicados con sencillez
La mezcla de expertos permite que un modelo sea enorme pero barato de ejecutar usando solo una porción de sí mismo por entrada. Aquí va la idea, en claro, y por qué importa.
Temperatura, top-p y muestreo: controlar la salida del modelo
La temperatura y el top-p deciden cómo elige un modelo su siguiente palabra. Saber qué hace cada uno te permite ajustar la salida de rígida a creativa a propósito.
Por qué dos ejecuciones del mismo prompt difieren
"Envía el mismo prompt dos veces y sueles obtener dos respuestas distintas. Es por diseño, no un fallo, y saber por qué te dice cuándo controlarlo."
Modelos pequeños, grandes tareas: cuándo el dispositivo gana a la nube
El modelo más grande rara vez es el adecuado. Aquí está por qué los modelos pequeños en el dispositivo ganan clases enteras de tareas.
















