Llega la factura del 'tokenmaxxing': las grandes tecnológicas empiezan a racionar los tokens de IA

Tras un año premiando el uso bruto de IA, Meta, Uber y otras limitan los presupuestos de tokens y persiguen la eficiencia.

use-cases2026-06-28 22:00 KST·Editor jefe·6 min

Un ajuste de cuentas, no un lanzamiento

La mayor noticia sobre IA de la última semana no es el lanzamiento de un modelo. Es una reunión de presupuesto. Tras casi dos años en los que las grandes empresas trataron el consumo de IA como un indicador de innovación —pagando a sus empleados, en la práctica, por usar todo lo posible—, las facturas han llegado, y son enormes. CNBC informó el 26 de junio de que OpenAI y Anthropic se enfrentan ahora a una "nueva realidad de la IA", a medida que sus mayores clientes pasan de maximizar el uso a minimizarlo. El cambio incluso tiene nombre: la industria llamó "tokenmaxxing" al viejo comportamiento, y "tokenminimizing" a la corrección.

Esto importa más que cualquier benchmark concreto. Los laboratorios de frontera han construido sus relatos de ingresos sobre la premisa de que el consumo de tokens solo puede subir. Si sus mayores compradores empresariales están ahora trabajando activamente para bajarlo, la economía de todo el sector se ve distinta de como se veía hace un trimestre.

Cómo se descontroló el "tokenmaxxing"

La práctica nació de un instinto razonable que se volvió salvaje. A lo largo de 2025, las empresas querían que sus empleados adoptaran la IA rápido, así que midieron la adopción, y lo que se mide se manipula. Varias grandes tecnológicas crearon tablas de clasificación internas que ordenaban al personal según su consumo de tokens. Según información recopilada por BigGo Finance, Amazon tenía una llamada "Kirorank" que cerró en mayo después de que "degenerara en concursos derrochadores de caza de tokens sin ningún valor práctico". MLQ News informa de que Meta registraba el uso en una tabla apodada "Claudeonomics" que, en palabras de la propia empresa, "incentivaba inadvertidamente el volumen por encima de la productividad".

El resultado fue una métrica que premiaba el movimiento por encima del progreso. Los ingenieros aprendieron que ejecutar más agentes, cadenas más largas y ventanas de contexto más grandes sumaba puntos, sin importar si algo llegaba a producción. Como el precio de la IA escala directamente con el uso, ese comportamiento gamificado se tradujo en facturas grandes e impredecibles.

Las cifras detrás del pánico

Los números, donde las fuentes los citan, son llamativos. Según MLQ News, un memorando interno de Meta dirigido a 6.000 empleados describía un "aumento exponencial" de los costes de IA, y señalaba que el personal consumió 73,7 billones de tokens en aproximadamente 30 días, con un gasto interno en IA que se acercaba a los miles de millones de dólares en 2026. (Meta planea, por separado, gastar hasta 135.000 millones de dólares en infraestructura de IA a lo largo del año.) La respuesta de Meta: un panel "AI Gateway" para la monitorización en tiempo real, presupuestos formales de tokens a partir de 2027 y un empujón hacia su herramienta interna MetaCode en lugar de Claude de Anthropic. El CTO Andrew Bosworth resumió la nueva postura sin rodeos: "Todo movimiento no es progreso, y el uso de tokens por sí solo no es una medida de impacto".

Uber es el caso aleccionador que todos citan. MLQ News informa de que agotó todo su presupuesto de IA para programación de 2026 en unos cuatro meses e impuso un tope de 1.500 dólares mensuales por herramienta y empleado; BigGo sitúa los costes por ingeniero entre 500 y 2.000 dólares mensuales antes del tope, con un 95 % de los ingenieros usando la herramienta cada mes. Microsoft, según el relato de BigGo, revocó la mayoría de las licencias internas de Claude Code en una división y devolvió a sus ingenieros a GitHub Copilot CLI por una facturación "ingobernable". Se describe a Meta, AT&T y Walmart ajustando todas su gasto interno en IA. Estas cifras concretas provienen de información secundaria y no de presentaciones oficiales de las empresas, así que conviene tomar los números exactos como indicativos y no como auditados; pero la dirección es coherente en todas las fuentes.

El verdadero problema: el uso no es producción

El núcleo incómodo de la historia es que el gasto y los resultados se han desligado. CNBC informa de que, pese a que alrededor del 70 % del código incorporado en Uber es generado por IA, el COO Andrew Macdonald afirmó que el vínculo entre el gasto en tokens y la producción medible "todavía no está ahí". La información de BigGo plantea esa misma brecha de forma cuantitativa, al afirmar que los commits de código crecieron mucho más rápido que las versiones en producción y que las herramientas agénticas pueden consumir del orden de mil veces más tokens que un chat ordinario para un rendimiento efectivo bajo. Esas proporciones de productividad son modelización propia del artículo y deben leerse con escepticismo, pero el punto cualitativo se repite ampliamente: más tokens no significaban de forma fiable más software entregado.

Esa brecha es la razón por la que la propia métrica está cambiando. CNBC informa de que el CEO de Salesforce, Marc Benioff, dice que la empresa todavía planea gastar fuerte en IA este año, pero ahora mide "unidades de trabajo agéntico" (agentic work units), una métrica pensada para captar la producción en lugar del consumo bruto. El replanteamiento es la verdadera noticia. Las empresas no están abandonando la IA; están intentando redefinir qué significa el éxito para que la factura se corresponda con el valor.

Las soluciones: gateways, enrutadores y modelos más baratos

Se está formando un pequeño ecosistema en torno al control de costes. CNBC señala una demanda creciente de herramientas "gateway" y enrutadores de modelos que monitorizan, limitan y optimizan el gasto, con Microsoft y Databricks lanzando productos relevantes y una startup llamada Factory presentando un enrutador que envía automáticamente las tareas de baja complejidad a modelos más baratos. La lógica es simple: la mayoría de los prompts no necesitan un modelo de frontera, y enrutarlos a uno más pequeño preserva la calidad donde importa mientras recorta la factura en todo lo demás.

El ejemplo más contundente es una deserción. CNBC informa de que el CEO de la startup de IA Lindy trasladó el 100 % del tráfico de su empresa de Claude de Anthropic a DeepSeek, el laboratorio chino conocido por alternativas más baratas de pesos abiertos, esperando ahorrar millones en cuestión de meses. Una startup es una anécdota, no una tendencia, pero es exactamente la sustitución que los laboratorios de frontera deben temer si su precio premium no va acompañado de resultados premium.

El bombo frente a la realidad

Conviene ser preciso sobre lo que esto es y lo que no es. No es prueba de que la demanda empresarial de IA se esté hundiendo. Benioff todavía pretende gastar cientos de millones; Meta sigue volcando decenas de miles de millones en infraestructura; el uso se está racionalizando, no apagando. Goldman Sachs, según MLQ News, todavía proyecta un aumento de aproximadamente 24 veces en el consumo empresarial de tokens para 2030. El ajuste de cuentas va de disciplina, no de retirada.

Pero sí es un genuino reajuste del precio del riesgo. El argumento alcista para OpenAI y Anthropic —ambas supuestamente preparando salidas a bolsa— se apoyaba en la idea de que el crecimiento del consumo es prácticamente ilimitado. Una base de clientes que ahora presupuesta tokens, sortea los modelos premium y exige pruebas de resultados introduce un techo que no estaba en la hoja de cálculo hace unos meses. También premia a los líderes en eficiencia: los modelos de pesos abiertos más baratos y el enrutamiento más inteligente se benefician directamente de la misma ansiedad que presiona a los laboratorios de frontera. Buena parte de la información detallada aquí es secundaria, y los números primarios de las empresas son escasos, así que la lectura más segura es la narrativa compartida entre las fuentes más que cualquier estadística aislada.

En resumen

Durante dos años, la métrica favorita de la industria de la IA fue "más". La información de la última semana marca el momento en que esa premisa se rompió en público: las mismas empresas que construyeron tablas de clasificación de tokens construyen ahora presupuestos de tokens. La sustancia es real —el memorando de Meta, el tope de Uber, el marcador eliminado de Amazon—, aunque las cifras exactas provengan en su mayoría de medios secundarios y merezcan cautela. El mensaje estratégico es más claro que cualquier número. La próxima fase de la IA empresarial no la ganará quien queme más tokens, sino quien convierta cada token en algo que llegue a producción. Es un juego más difícil, y favorece a la eficiencia, el enrutamiento y los modelos más baratos tanto como favorece a la frontera.

#enterprise-ai#token-economics#agentic-coding#cost-optimization

Fuentes primarias

OpenAI and Anthropic face new AI reality as users shift from 'tokenmaxxing' to efficiency (CNBC)Meta Caps Internal AI Token Spending After Costs Approach Billions in 2026 (MLQ News)Silicon Valley's AI Bubble Burst: Three Months to Burn a Year's Budget (BigGo Finance)