welclaiAI·TREND·DIGEST
应用案例

"Token 狂飙"的账单到了:科技巨头开始为 AI Token 配给

在以原始 AI 用量为奖励的一年之后,Meta、Uber 等公司转而设定 token 预算、追求效率。

use-cases2026-06-28 22:00 KST·主编·6 分钟

这是清算,而非松绑

过去一周最大的 AI 新闻不是某款模型发布,而是一场预算会议。在大约两年时间里,大公司一直把 AI 消耗量当作创新的代名词——实际上是在花钱让员工尽可能多地使用——如今账单来了,而且数额惊人。CNBC 在 6 月 26 日报道称,OpenAI 和 Anthropic 如今面临一种"AI 新现实":它们最大的客户正从最大化用量转向最小化用量。这种转变甚至有了名字:业界把过去那种行为称为"tokenmaxxing"(token 狂飙),把如今的纠偏称为"tokenminimizing"(token 最小化)。

这件事比任何单一基准测试都更重要。前沿实验室的营收叙事都建立在一个假设之上:token 消耗量只会上升。如果它们最大的企业买家如今正主动想方设法把消耗量压下去,那么整个行业的经济账,看起来就和一个季度前大不相同了。

"Token 狂飙"是如何失控的

这种做法源于一种合理的本能,却变得野蛮生长。整个 2025 年,企业都希望员工快速采用 AI,于是就去衡量采用度——而被衡量的东西就会被钻空子。几家大型科技公司都搞了内部排行榜,按 token 消耗量给员工排名。根据 BigGo Finance 汇总的报道,亚马逊搞过一个名为"Kirorank"的排行榜,并在 5 月将其关停,因为它"沦为了毫无实际价值、浪费成性的 token 争夺竞赛"。MLQ News 报道称,Meta 在一个绰号"Claudeonomics"的排行榜上追踪用量,而用该公司自己的说法,这"无意中激励了重数量而非重生产力"的行为。

结果就是一个奖励"动作"而非"进展"的指标。工程师们发现,运行更多智能体、更长的调用链、更大的上下文窗口就能拿分——而不管最终有没有交付任何东西。由于 AI 定价与用量直接挂钩,这种被游戏化的行为转化成了巨额且难以预测的账单。

恐慌背后的数字

在有来源引用的地方,这些数字相当惊人。据 MLQ News 报道,Meta 一份发给 6000 名员工的内部备忘录提到 AI 成本"呈指数级增长",指出员工在大约 30 天内消耗了 73.7 万亿个 token,2026 年的内部 AI 支出逼近数十亿美元。(Meta 另外计划全年在 AI 基础设施上投入高达 1350 亿美元。)Meta 的应对措施是:推出用于实时监控的"AI Gateway"看板,从 2027 年起设立正式的 token 预算,并引导员工使用自家的 MetaCode 工具,而非 Anthropic 的 Claude。CTO Andrew Bosworth 直白地概括了这一新姿态:"所有的动作都不等于进展,光看 token 用量并不能衡量影响力。"

Uber 是人人都会援引的前车之鉴。MLQ News 报道称,它在大约四个月内就烧光了整个 2026 年的 AI 编程预算,并对每名员工的每款工具实行每月 1500 美元的上限;BigGo 给出的数据是,设上限前每名工程师的月成本在 500 至 2000 美元区间,且 95% 的工程师每月都在使用该工具。据 BigGo 介绍,微软在某个部门撤销了大部分内部 Claude Code 许可,把工程师推回 GitHub Copilot CLI,原因是账单"无法管理"。Meta、AT&T 和沃尔玛也都被描述为正在收紧内部 AI 支出。这些具体数字来自二手报道,而非公司财报,因此应把确切数字视为参考性的、而非经过审计的——但每个来源指向的方向是一致的。

真正的问题:用量不等于产出

这个故事令人不安的核心在于,支出和成果已经脱钩。CNBC 报道称,尽管 Uber 提交的代码中约有 70% 是 AI 生成的,但其 COO Andrew Macdonald 表示,token 支出与可衡量产出之间的关联"目前还不存在"。BigGo 的报道从量化角度刻画了同样的落差,称代码提交量的激增速度远超生产环境发布的速度,而智能体类工具消耗的 token 量可能达到普通聊天的约一千倍,有效回报却很低。这些生产力比率是该文章自己的建模,应当审慎看待,但其定性结论被广泛认同:更多的 token 并不能可靠地意味着更多软件得以交付。

正是这种落差,让指标本身发生了改变。CNBC 报道称,Salesforce CEO Marc Benioff 表示公司今年仍计划在 AI 上大笔投入,但如今追踪的是"智能体工作单元"(agentic work units)——一种意在衡量产出而非原始消耗的指标。这种重新定义才是真正的新闻。企业并没有放弃 AI;它们是在试图重新定义成功的样子,好让账单对应到价值上。

解决方案:网关、路由器和更便宜的模型

一个围绕成本控制的小型生态正在形成。CNBC 指出,用于监控、设限和优化支出的"网关"工具和模型路由器需求正在上升,微软和 Databricks 推出了相关产品,一家名为 Factory 的初创公司发布了一款路由器,能自动把低复杂度任务发送给更便宜的模型。逻辑很简单:大多数提示词并不需要前沿模型,把它们路由到更小的模型,能在重要之处保住质量,同时在其他各处削减账单。

最尖锐的例子是一次"叛逃"。CNBC 报道称,AI 初创公司 Lindy 的 CEO 把公司 100% 的流量从 Anthropic 的 Claude 转移到了 DeepSeek——这家中国实验室以更便宜的开放权重替代方案闻名——预计几个月内就能省下数百万美元。一家初创公司只是个案,算不上趋势——但如果前沿实验室的高价配不上高质量的结果,这恰恰是它们必须惧怕的那种替代。

炒作与现实

有必要把这件事的本质和非本质说清楚。它并不能证明企业级 AI 需求正在崩塌。Benioff 仍打算投入数亿美元;Meta 仍在向基础设施砸下数百亿美元;用量是在被理性化,而不是被关停。据 MLQ News,高盛仍预测到 2030 年企业 token 消耗量将增长约 24 倍。这场清算关乎的是纪律,而非撤退。

但它确实是一次对风险的真实重新定价。OpenAI 和 Anthropic 的看涨逻辑——据报道两家都在筹备 IPO——倚仗的是消耗量增长实际上无上限这一观念。一个如今会给 token 编预算、绕开高价模型、并要求拿出产出证据的客户群,引入了一个几个月前还不在表格里的天花板。这也奖励了效率上的领先者:更便宜的开放权重模型和更聪明的路由,直接受益于那份给前沿实验室施压的同一种焦虑。这里许多细颗粒度的报道都是二手的,公司一手数字又很稀缺,因此最稳妥的解读是各来源共有的叙事,而非任何单一数据。

总结

两年来,AI 行业最钟爱的指标就是"更多"。上周的报道标志着这一假设在公众面前破裂的时刻:那些当初搭建 token 排行榜的公司,如今正在编制 token 预算。实质内容是真实的——Meta 的备忘录、Uber 的上限、亚马逊被砍掉的计分板——尽管确切数字大多来自二手媒体,值得谨慎对待。其战略信息比任何数字都更清晰。企业级 AI 的下一阶段,赢家不会是烧掉最多 token 的人,而是把每一个 token 都变成能交付之物的人。这是一场更难的游戏,而它青睐效率、路由和更便宜的模型,一如它青睐前沿。

#enterprise-ai#token-economics#agentic-coding#cost-optimization