Todo Modelos Herramientas Investigación Casos de uso Política Tutoriales

Modelos

Modelos, versiones y contexto de los benchmarks

Embeddings frente a generación: dos cosas que hacen los modelos

"Los embeddings y la generación son trabajos distintos. Saber cuál necesita tu problema es la vía más rápida hacia un sistema que funciona."

#embeddings#generation#retrieval

06-15 11:41·7 min

models

El costo de un token: cómo funciona el precio de los modelos

"Las facturas de los modelos se miden en tokens, no en palabras ni solicitudes. Entender qué es un token, y cuáles pagas, mantiene el costo predecible."

#tokens#pricing#cost-management

06-12 15:45·7 min

models

Ventanas de contexto explicadas: tokens, atención y dónde se rompe el contexto largo

Una ventana de contexto más grande no es lo mismo que mejor memoria. Aquí está qué es de verdad, por qué se degrada con entradas largas y cómo diseñar.

#context-window#tokens#attention

06-02 10:06·7 min

models

Qué significa de verdad un "modelo frontera" — y por qué los benchmarks engañan

"Modelo frontera" es una etiqueta móvil, no una ficha técnica. Esto es a lo que apunta, por qué los rankings rara vez sirven y cómo elegir bien igualmente.

#frontier-models#benchmarks#evaluation

06-01 19:11·7 min

models

Cómo se entrenan los grandes modelos de lenguaje, en lenguaje llano

Entrenar un modelo de lenguaje ocurre por etapas, no en un paso mágico. Qué hace cada etapa, en lenguaje llano, y por qué el orden importa.

#training#pretraining#fine-tuning

06-01 12:06·7 min

models

Modelos de pesos abiertos vs código abierto: la diferencia real

"Los dos términos se usan como sinónimos y no lo son. Lo que puedes descargar, inspeccionar y reutilizar difiere mucho, y afecta a lo que tienes permitido hacer."

#open-weight#open-source#licensing

05-29 16:50·7 min

models

Por qué los modelos tienen cortes de conocimiento

El conocimiento de un modelo se detiene en una fecha porque queda congelado en el entrenamiento. Por qué ocurre y cómo lo sortean las herramientas.

#knowledge-cutoff#training-data#retrieval

05-25 16:26·7 min

models

Modelos multimodales: qué significa de verdad "puede ver"

Cuando un modelo "ve" una imagen, no está mirando como tú. Aquí va cómo funcionan de verdad los modelos multimodales, qué habilitan y dónde fallan en silencio.

#multimodal#vision#image-understanding

05-22 12:04·7 min

models

Tokens y tokenización: por qué los modelos ven el texto de forma extraña

Los modelos no leen letras ni palabras: leen tokens. Entender ese hecho explica los fallos de ortografía, los costes raros y los límites de contexto.

#tokens#tokenization#context-window

05-14 16:37·7 min

models

Modelos abiertos frente a cerrados: cómo elegir para un proyecto real

¿Pesos abiertos o una API alojada? La respuesta correcta depende del control, el coste y el riesgo, no de la ideología. Aquí va un marco que sobrevive al contacto con producción.

#open-weights#model-selection#deployment

05-11 14:31·7 min

models

Modelos de razonamiento: qué hacen los tokens de "pensamiento"

"Los modelos de razonamiento trabajan el problema antes de responder. Ese trabajo oculto cuesta tiempo y tokens, y solo rinde en el tipo de tarea adecuado."

#reasoning-models#thinking-tokens#inference

04-29 14:40·7 min

models

Qué son de verdad los "parámetros" de un modelo

"Miles de millones de parámetros" se cita como si fueran caballos de fuerza. Esto es qué es un parámetro, por qué importa el recuento y por qué más no es mejor.

#parameters#model-size#weights

04-21 18:59·7 min

models

Cuantización y destilación: hacer los modelos más pequeños

"Dos formas distintas de encoger un modelo: una cambia sus números, la otra entrena una copia más pequeña. Así funciona cada una y cuándo recurrir a ella."

#quantization#distillation#model-compression

04-12 16:37·7 min

models

Modelos de mezcla de expertos, explicados con sencillez

La mezcla de expertos permite que un modelo sea enorme pero barato de ejecutar usando solo una porción de sí mismo por entrada. Aquí va la idea, en claro, y por qué importa.

#mixture-of-experts#architecture#efficiency

04-11 13:35·7 min

models

Temperatura, top-p y muestreo: controlar la salida del modelo

La temperatura y el top-p deciden cómo elige un modelo su siguiente palabra. Saber qué hace cada uno te permite ajustar la salida de rígida a creativa a propósito.

#sampling#temperature#top-p

04-06 09:43·7 min

models

Por qué dos ejecuciones del mismo prompt difieren

"Envía el mismo prompt dos veces y sueles obtener dos respuestas distintas. Es por diseño, no un fallo, y saber por qué te dice cuándo controlarlo."

#sampling#temperature#determinism

04-04 15:31·7 min

models

Modelos pequeños, grandes tareas: cuándo el dispositivo gana a la nube

El modelo más grande rara vez es el adecuado. Aquí está por qué los modelos pequeños en el dispositivo ganan clases enteras de tareas.

#small-models#on-device#edge-ai

04-01 12:28·7 min