welclaiAI·TREND·DIGEST

Modelos

Modelos, versiones y contexto de los benchmarks

models

Embeddings frente a generación: dos cosas que hacen los modelos

"Los embeddings y la generación son trabajos distintos. Saber cuál necesita tu problema es la vía más rápida hacia un sistema que funciona."

#embeddings#generation#retrieval
06-15 11:41·7 min
models

El costo de un token: cómo funciona el precio de los modelos

"Las facturas de los modelos se miden en tokens, no en palabras ni solicitudes. Entender qué es un token, y cuáles pagas, mantiene el costo predecible."

#tokens#pricing#cost-management
06-12 15:45·7 min
models

Ventanas de contexto explicadas: tokens, atención y dónde se rompe el contexto largo

Una ventana de contexto más grande no es lo mismo que mejor memoria. Aquí está qué es de verdad, por qué se degrada con entradas largas y cómo diseñar.

#context-window#tokens#attention
06-02 10:06·7 min
models

Qué significa de verdad un "modelo frontera" — y por qué los benchmarks engañan

"Modelo frontera" es una etiqueta móvil, no una ficha técnica. Esto es a lo que apunta, por qué los rankings rara vez sirven y cómo elegir bien igualmente.

#frontier-models#benchmarks#evaluation
06-01 19:11·7 min
models

Cómo se entrenan los grandes modelos de lenguaje, en lenguaje llano

Entrenar un modelo de lenguaje ocurre por etapas, no en un paso mágico. Qué hace cada etapa, en lenguaje llano, y por qué el orden importa.

#training#pretraining#fine-tuning
06-01 12:06·7 min
models

Modelos de pesos abiertos vs código abierto: la diferencia real

"Los dos términos se usan como sinónimos y no lo son. Lo que puedes descargar, inspeccionar y reutilizar difiere mucho, y afecta a lo que tienes permitido hacer."

#open-weight#open-source#licensing
05-29 16:50·7 min
models

Por qué los modelos tienen cortes de conocimiento

El conocimiento de un modelo se detiene en una fecha porque queda congelado en el entrenamiento. Por qué ocurre y cómo lo sortean las herramientas.

#knowledge-cutoff#training-data#retrieval
05-25 16:26·7 min
models

Modelos multimodales: qué significa de verdad "puede ver"

Cuando un modelo "ve" una imagen, no está mirando como tú. Aquí va cómo funcionan de verdad los modelos multimodales, qué habilitan y dónde fallan en silencio.

#multimodal#vision#image-understanding
05-22 12:04·7 min
models

Tokens y tokenización: por qué los modelos ven el texto de forma extraña

Los modelos no leen letras ni palabras: leen tokens. Entender ese hecho explica los fallos de ortografía, los costes raros y los límites de contexto.

#tokens#tokenization#context-window
05-14 16:37·7 min
models

Modelos abiertos frente a cerrados: cómo elegir para un proyecto real

¿Pesos abiertos o una API alojada? La respuesta correcta depende del control, el coste y el riesgo, no de la ideología. Aquí va un marco que sobrevive al contacto con producción.

#open-weights#model-selection#deployment
05-11 14:31·7 min
models

Modelos de razonamiento: qué hacen los tokens de "pensamiento"

"Los modelos de razonamiento trabajan el problema antes de responder. Ese trabajo oculto cuesta tiempo y tokens, y solo rinde en el tipo de tarea adecuado."

#reasoning-models#thinking-tokens#inference
04-29 14:40·7 min
models

Qué son de verdad los "parámetros" de un modelo

"Miles de millones de parámetros" se cita como si fueran caballos de fuerza. Esto es qué es un parámetro, por qué importa el recuento y por qué más no es mejor.

#parameters#model-size#weights
04-21 18:59·7 min
models

Cuantización y destilación: hacer los modelos más pequeños

"Dos formas distintas de encoger un modelo: una cambia sus números, la otra entrena una copia más pequeña. Así funciona cada una y cuándo recurrir a ella."

#quantization#distillation#model-compression
04-12 16:37·7 min
models

Modelos de mezcla de expertos, explicados con sencillez

La mezcla de expertos permite que un modelo sea enorme pero barato de ejecutar usando solo una porción de sí mismo por entrada. Aquí va la idea, en claro, y por qué importa.

#mixture-of-experts#architecture#efficiency
04-11 13:35·7 min
models

Temperatura, top-p y muestreo: controlar la salida del modelo

La temperatura y el top-p deciden cómo elige un modelo su siguiente palabra. Saber qué hace cada uno te permite ajustar la salida de rígida a creativa a propósito.

#sampling#temperature#top-p
04-06 09:43·7 min
models

Por qué dos ejecuciones del mismo prompt difieren

"Envía el mismo prompt dos veces y sueles obtener dos respuestas distintas. Es por diseño, no un fallo, y saber por qué te dice cuándo controlarlo."

#sampling#temperature#determinism
04-04 15:31·7 min
models

Modelos pequeños, grandes tareas: cuándo el dispositivo gana a la nube

El modelo más grande rara vez es el adecuado. Aquí está por qué los modelos pequeños en el dispositivo ganan clases enteras de tareas.

#small-models#on-device#edge-ai
04-01 12:28·7 min