welclaiAI·TREND·DIGEST
活用事例

「トークンマックス」のツケが回ってきた——大手テックがAIトークンの配給制を導入

AI利用量そのものを評価してきた1年を経て、MetaやUberなどがトークン予算に上限を設け、効率性の追求へと舵を切っています。

use-cases2026-06-28 22:00 KST·編集長·6

解放ではなく、清算の時

この1週間で最大のAIニュースは、モデルのローンチではありません。予算会議です。大企業がAIの消費量をイノベーションの代理指標として扱い——実質的に従業員へできる限り多く使うよう報酬を与えてきた——約2年を経て、請求書が届きました。そしてその額は莫大です。CNBCは6月26日、OpenAIとAnthropicが「新たなAIの現実」に直面していると報じました。最大の顧客たちが、利用量の最大化から最小化へと方針を転換しているのです。この変化には名前さえ付いています。業界は従来の振る舞いを「トークンマックス(tokenmaxxing)」と呼び、その是正を「トークンミニマイズ(tokenminimizing)」と呼んでいます。

これはいかなる単一のベンチマークよりも重要な意味を持ちます。フロンティアラボは、トークン消費量は増え続けるという前提の上に収益ストーリーを築いてきました。もし最大手の法人顧客が今、その量を能動的に引き下げようとしているなら、業界全体の経済性は四半期前とはまったく異なって見えてきます。

「トークンマックス」はいかにして暴走したか

この慣行は、まっとうな本能が野生化した結果として生まれました。2025年を通じて、企業は従業員に素早くAIを採用してほしかったため、採用度を測定しました——そして測定されるものは攻略の対象になります。複数の大手テック企業は、従業員をトークン消費量でランク付けする社内リーダーボードを運用していました。BigGo Financeがまとめた報道によれば、Amazonは「Kirorank」と呼ばれるものを運用していましたが、それが「実用的価値ゼロの、無駄なトークン獲得競争へと堕した」ことを受け、5月に廃止しました。MLQ Newsの報道では、Metaは「Claudeonomics」というあだ名のリーダーボードで利用量を追跡しており、同社自身の言葉を借りれば、それは「意図せず生産性よりも量を奨励してしまった」ものでした。

その結果生まれたのは、進捗ではなく動きに報いる指標でした。エンジニアたちは、より多くのエージェントを走らせ、より長いチェーンを組み、より大きなコンテキストウィンドウを使えばポイントが稼げると学びました——何かが実際にリリースされたかどうかとは無関係に。AIの料金体系は利用量に直接比例するため、こうしたゲーム化された振る舞いは、巨額で予測不能な請求へと姿を変えました。

パニックの背後にある数字

数字は、出典が挙げているものに限れば、衝撃的です。MLQ Newsによると、6,000人の従業員に宛てられたMetaの社内メモは、AIコストの「指数関数的な増加」を記述し、従業員が約30日間で73.7兆トークンを消費したこと、そして2026年の社内AI支出が数十億ドルに迫りつつあることを指摘していました。(Metaは別途、年内にAIインフラへ最大1,350億ドルを投じる計画です。)Metaの対応は、リアルタイム監視のための「AI Gateway」ダッシュボード、2027年からの正式なトークン予算、そしてAnthropicのClaudeよりも自社製のMetaCodeツールへ誘導することでした。CTOのAndrew Boswothはこの新たな姿勢を率直にこう要約しました。「すべての動きが進捗ではないし、トークン利用量だけではインパクトの尺度にはならない」。

Uberは、誰もが引き合いに出す教訓的事例です。MLQ Newsによれば、同社は2026年のAIコーディング予算全体を約4か月で使い果たし、従業員1人あたりツールごとに月1,500ドルの上限を課しました。BigGoによると、上限導入前のエンジニア1人あたりコストは月500〜2,000ドルの範囲で、エンジニアの95%が月次でこのツールを使っていました。BigGoの記述では、Microsoftはある部門で社内のClaude Codeライセンスの大半を取り消し、「管理不能」な請求を理由にエンジニアをGitHub Copilot CLIへ戻しました。Meta、AT&T、Walmartはいずれも社内AI支出を引き締めていると報じられています。これらの具体的な数字は企業の提出書類ではなく二次的な報道に由来するため、正確な数値は監査済みというより目安として受け止めるべきです——とはいえ、その方向性はすべての情報源で一貫しています。

本当の問題——利用量はアウトプットではない

この話の居心地の悪い核心は、支出と成果が乖離してしまったことにあります。CNBCの報道によれば、Uberでコミットされるコードのおよそ70%がAI生成であるにもかかわらず、COOのAndrew Macdonaldは、トークン支出と測定可能なアウトプットとの結びつきは「まだそこには至っていない」と述べました。BigGoの報道は同じギャップを定量的に捉え、コードのコミットが本番リリースよりはるかに速いペースで急増したこと、そしてエージェント型ツールが通常のチャットの千倍ほどのトークンを消費しながら実効リターンは低いことを主張しています。こうした生産性の比率はこの記事独自のモデル化であり、懐疑的に読むべきですが、その定性的な論点は広く反響を呼んでいます——トークンが増えても、それが確実にリリースされたソフトウェアの増加を意味したわけではなかった、ということです。

このギャップこそが、指標そのものが変わりつつある理由です。CNBCの報道によれば、Salesforce CEOのMarc Benioffは、同社は今年も引き続きAIに多額を投じる計画だとしつつ、現在は「エージェント型ワークユニット(agentic work units)」——生の消費量ではなくアウトプットを捉えることを意図した尺度——を追跡していると述べています。この捉え直しこそが真のニュースです。企業はAIを捨てているのではありません。請求が価値に対応するよう、成功の定義を再設定しようとしているのです。

解決策——ゲートウェイ、ルーター、そしてより安価なモデル

コスト管理をめぐって、小さなエコシステムが形成されつつあります。CNBCは、支出を監視・上限設定・最適化する「ゲートウェイ」ツールやモデルルーターへの需要が高まっていると指摘しています。MicrosoftとDatabricksが関連製品を投入しており、Factoryというスタートアップは、複雑度の低いタスクを自動的により安価なモデルへ振り分けるルーターをリリースしました。論理は単純です。ほとんどのプロンプトはフロンティアモデルを必要とせず、それらを小型モデルへ振り分ければ、重要なところでは品質を保ちつつ、それ以外のあらゆる場所で請求を削減できるのです。

最も的を射た例は、ある「離反」です。CNBCの報道によれば、AIスタートアップLindyのCEOは、自社のトラフィックを100%、AnthropicのClaudeから——より安価なオープンウェイトの代替で知られる中国のラボ——DeepSeekへ移行し、数か月以内に数百万ドルの節約を見込んでいます。一つのスタートアップは逸話であってトレンドではありません——しかしこれこそ、プレミアム価格にプレミアムな成果が伴わなければフロンティアラボが恐れるべき、まさにその代替行動です。

誇大宣伝と現実

これが何であり、何でないのかを正確に捉えておく価値があります。これは法人向けAI需要が崩壊しつつある証拠ではありません。Benioffは依然として数億ドルを投じるつもりですし、Metaは依然として数百億ドルをインフラに注ぎ込んでいます。利用は合理化されているのであって、スイッチが切られているわけではありません。MLQ Newsによれば、Goldman Sachsは今なお2030年までに法人のトークン消費量がおよそ24倍に増えると予測しています。この清算は規律の話であって、撤退の話ではありません。

しかしこれは、リスクの真の再評価ではあります。OpenAIとAnthropic——両社とも新規株式公開(IPO)を準備中と報じられています——の強気シナリオは、消費の成長は事実上無限であるという考えに依拠していました。今やトークンに予算を組み、プレミアムモデルを回避し、アウトプットの証明を求める顧客層は、数か月前のスプレッドシートには存在しなかった上限をもたらします。それはまた、効率性のリーダーに報いるものでもあります——より安価なオープンウェイトモデルと、より賢いルーティングは、フロンティアラボを圧迫しているのと同じ不安から直接的に恩恵を受けるのです。ここでの細かな報道の多くは二次的なものであり、企業の一次的な数字は乏しいため、最も安全な読み方は、いずれか一つの統計ではなく、複数の情報源にまたがる共通の物語に注目することです。

まとめ

2年間、AI業界のお気に入りの指標は「もっと多く」でした。先週の報道は、その前提が公の場で崩れた瞬間を示しています。トークンのリーダーボードを作った当の企業が、今やトークンの予算を作っているのです。その実体は本物です——Metaのメモ、Uberの上限設定、Amazonが葬ったスコアボード——たとえ正確な数字の大半が二次的な媒体に由来し、慎重さを要するとしても。戦略的なメッセージは、どんな数字よりも明確です。法人向けAIの次の局面は、最も多くのトークンを燃やした者ではなく、各トークンをリリースに値する何かへと変える者が制するでしょう。それはより難しいゲームであり、フロンティアと同じくらい、効率性、ルーティング、そしてより安価なモデルに有利に働くゲームなのです。

#enterprise-ai#token-economics#agentic-coding#cost-optimization