"Token 狂飙"的账单到了：科技巨头开始为 AI Token 配给

在以原始 AI 用量为奖励的一年之后，Meta、Uber 等公司转而设定 token 预算、追求效率。

use-cases2026-06-28 22:00 KST·主编·6 分钟

这是清算，而非松绑

过去一周最大的 AI 新闻不是某款模型发布，而是一场预算会议。在大约两年时间里，大公司一直把 AI 消耗量当作创新的代名词——实际上是在花钱让员工尽可能多地使用——如今账单来了，而且数额惊人。CNBC 在 6 月 26 日报道称，OpenAI 和 Anthropic 如今面临一种"AI 新现实"：它们最大的客户正从最大化用量转向最小化用量。这种转变甚至有了名字：业界把过去那种行为称为"tokenmaxxing"（token 狂飙），把如今的纠偏称为"tokenminimizing"（token 最小化）。

这件事比任何单一基准测试都更重要。前沿实验室的营收叙事都建立在一个假设之上：token 消耗量只会上升。如果它们最大的企业买家如今正主动想方设法把消耗量压下去，那么整个行业的经济账，看起来就和一个季度前大不相同了。

"Token 狂飙"是如何失控的

这种做法源于一种合理的本能,却变得野蛮生长。整个 2025 年，企业都希望员工快速采用 AI，于是就去衡量采用度——而被衡量的东西就会被钻空子。几家大型科技公司都搞了内部排行榜，按 token 消耗量给员工排名。根据 BigGo Finance 汇总的报道，亚马逊搞过一个名为"Kirorank"的排行榜，并在 5 月将其关停，因为它"沦为了毫无实际价值、浪费成性的 token 争夺竞赛"。MLQ News 报道称，Meta 在一个绰号"Claudeonomics"的排行榜上追踪用量，而用该公司自己的说法，这"无意中激励了重数量而非重生产力"的行为。

结果就是一个奖励"动作"而非"进展"的指标。工程师们发现，运行更多智能体、更长的调用链、更大的上下文窗口就能拿分——而不管最终有没有交付任何东西。由于 AI 定价与用量直接挂钩，这种被游戏化的行为转化成了巨额且难以预测的账单。

恐慌背后的数字

在有来源引用的地方，这些数字相当惊人。据 MLQ News 报道，Meta 一份发给 6000 名员工的内部备忘录提到 AI 成本"呈指数级增长"，指出员工在大约 30 天内消耗了 73.7 万亿个 token，2026 年的内部 AI 支出逼近数十亿美元。（Meta 另外计划全年在 AI 基础设施上投入高达 1350 亿美元。）Meta 的应对措施是：推出用于实时监控的"AI Gateway"看板，从 2027 年起设立正式的 token 预算，并引导员工使用自家的 MetaCode 工具，而非 Anthropic 的 Claude。CTO Andrew Bosworth 直白地概括了这一新姿态："所有的动作都不等于进展，光看 token 用量并不能衡量影响力。"

Uber 是人人都会援引的前车之鉴。MLQ News 报道称，它在大约四个月内就烧光了整个 2026 年的 AI 编程预算，并对每名员工的每款工具实行每月 1500 美元的上限；BigGo 给出的数据是，设上限前每名工程师的月成本在 500 至 2000 美元区间，且 95% 的工程师每月都在使用该工具。据 BigGo 介绍，微软在某个部门撤销了大部分内部 Claude Code 许可，把工程师推回 GitHub Copilot CLI，原因是账单"无法管理"。Meta、AT&T 和沃尔玛也都被描述为正在收紧内部 AI 支出。这些具体数字来自二手报道，而非公司财报，因此应把确切数字视为参考性的、而非经过审计的——但每个来源指向的方向是一致的。

真正的问题：用量不等于产出

这个故事令人不安的核心在于，支出和成果已经脱钩。CNBC 报道称，尽管 Uber 提交的代码中约有 70% 是 AI 生成的，但其 COO Andrew Macdonald 表示，token 支出与可衡量产出之间的关联"目前还不存在"。BigGo 的报道从量化角度刻画了同样的落差，称代码提交量的激增速度远超生产环境发布的速度，而智能体类工具消耗的 token 量可能达到普通聊天的约一千倍，有效回报却很低。这些生产力比率是该文章自己的建模，应当审慎看待，但其定性结论被广泛认同：更多的 token 并不能可靠地意味着更多软件得以交付。

正是这种落差，让指标本身发生了改变。CNBC 报道称，Salesforce CEO Marc Benioff 表示公司今年仍计划在 AI 上大笔投入，但如今追踪的是"智能体工作单元"（agentic work units）——一种意在衡量产出而非原始消耗的指标。这种重新定义才是真正的新闻。企业并没有放弃 AI；它们是在试图重新定义成功的样子，好让账单对应到价值上。

解决方案：网关、路由器和更便宜的模型

一个围绕成本控制的小型生态正在形成。CNBC 指出，用于监控、设限和优化支出的"网关"工具和模型路由器需求正在上升，微软和 Databricks 推出了相关产品，一家名为 Factory 的初创公司发布了一款路由器，能自动把低复杂度任务发送给更便宜的模型。逻辑很简单：大多数提示词并不需要前沿模型，把它们路由到更小的模型，能在重要之处保住质量，同时在其他各处削减账单。

最尖锐的例子是一次"叛逃"。CNBC 报道称，AI 初创公司 Lindy 的 CEO 把公司 100% 的流量从 Anthropic 的 Claude 转移到了 DeepSeek——这家中国实验室以更便宜的开放权重替代方案闻名——预计几个月内就能省下数百万美元。一家初创公司只是个案，算不上趋势——但如果前沿实验室的高价配不上高质量的结果，这恰恰是它们必须惧怕的那种替代。

炒作与现实

有必要把这件事的本质和非本质说清楚。它并不能证明企业级 AI 需求正在崩塌。Benioff 仍打算投入数亿美元；Meta 仍在向基础设施砸下数百亿美元；用量是在被理性化，而不是被关停。据 MLQ News，高盛仍预测到 2030 年企业 token 消耗量将增长约 24 倍。这场清算关乎的是纪律，而非撤退。

但它确实是一次对风险的真实重新定价。OpenAI 和 Anthropic 的看涨逻辑——据报道两家都在筹备 IPO——倚仗的是消耗量增长实际上无上限这一观念。一个如今会给 token 编预算、绕开高价模型、并要求拿出产出证据的客户群，引入了一个几个月前还不在表格里的天花板。这也奖励了效率上的领先者：更便宜的开放权重模型和更聪明的路由，直接受益于那份给前沿实验室施压的同一种焦虑。这里许多细颗粒度的报道都是二手的，公司一手数字又很稀缺，因此最稳妥的解读是各来源共有的叙事，而非任何单一数据。

总结

两年来，AI 行业最钟爱的指标就是"更多"。上周的报道标志着这一假设在公众面前破裂的时刻：那些当初搭建 token 排行榜的公司，如今正在编制 token 预算。实质内容是真实的——Meta 的备忘录、Uber 的上限、亚马逊被砍掉的计分板——尽管确切数字大多来自二手媒体，值得谨慎对待。其战略信息比任何数字都更清晰。企业级 AI 的下一阶段，赢家不会是烧掉最多 token 的人，而是把每一个 token 都变成能交付之物的人。这是一场更难的游戏，而它青睐效率、路由和更便宜的模型，一如它青睐前沿。

#enterprise-ai#token-economics#agentic-coding#cost-optimization

原始来源

OpenAI and Anthropic face new AI reality as users shift from 'tokenmaxxing' to efficiency (CNBC)Meta Caps Internal AI Token Spending After Costs Approach Billions in 2026 (MLQ News)Silicon Valley's AI Bubble Burst: Three Months to Burn a Year's Budget (BigGo Finance)