'토큰맥싱'의 청구서가 도착했다: 빅테크, AI 토큰 배급제를 시작하다

1년간 AI 사용량 자체에 보상을 안겨온 메타, 우버 등이 이제 토큰 예산에 상한을 두고 효율을 좇기 시작했습니다.

use-cases2026-06-28 22:00 KST·편집장·6 분

출시가 아니라 결산의 시간

지난 한 주 가장 큰 AI 뉴스는 모델 출시가 아닙니다. 예산 회의입니다. 대기업들이 AI 소비를 혁신의 대리지표로 여기며—사실상 직원들에게 가능한 한 많이 쓰라고 돈을 지불하며—보낸 약 2년이 지난 지금, 청구서가 도착했고 그 액수는 어마어마합니다. CNBC는 6월 26일, OpenAI와 Anthropic이 최대 고객들이 사용량 극대화에서 최소화로 방향을 트는 "새로운 AI 현실"에 직면했다고 보도했습니다. 이 변화에는 이름까지 붙었습니다. 업계는 과거의 행태를 "토큰맥싱(tokenmaxxing)"이라 불렀고, 그 교정 국면을 "토큰미니마이징(tokenminimizing)"이라 부릅니다.

이는 그 어떤 벤치마크보다 중요합니다. 프런티어 연구소들은 토큰 소비가 오로지 늘어나기만 한다는 가정 위에 매출 서사를 쌓아왔습니다. 그런데 최대 규모의 기업 고객들이 이제 그 소비를 적극적으로 낮추는 방향으로 설계하고 있다면, 업계 전체의 경제학은 불과 한 분기 전과는 다르게 보입니다.

"토큰맥싱"은 어쩌다 통제를 벗어났나

이 관행은 합리적이었던 본능이 야생화되며 자라났습니다. 2025년 내내 기업들은 직원들이 AI를 빠르게 도입하기를 원했고, 그래서 도입률을 측정했습니다—그리고 측정되는 것은 결국 게임의 대상이 됩니다. 여러 빅테크 기업이 토큰 소비량을 기준으로 직원 순위를 매기는 사내 리더보드를 운영했습니다. BigGo Finance가 정리한 보도에 따르면, 아마존은 "Kirorank"라는 이름의 리더보드를 운영하다가 그것이 "실질적 가치가 전혀 없는, 낭비적인 토큰 쫓기 경쟁으로 변질"되자 5월에 폐지했습니다. MLQ News에 따르면 메타는 "Claudeonomics"라는 별칭의 리더보드로 사용량을 추적했는데, 회사 자체 표현을 빌리면 이는 "의도치 않게 생산성보다 사용량을 부추겼다"고 합니다.

그 결과는 진척보다 움직임에 보상을 주는 지표였습니다. 엔지니어들은 더 많은 에이전트를 돌리고, 더 긴 체인을 이어가고, 더 큰 컨텍스트 윈도를 쓰면 점수를 딴다는 것을 배웠습니다—실제로 무언가 출시되든 말든 상관없이 말입니다. AI 가격은 사용량에 정비례하기 때문에, 그렇게 게임화된 행태는 거액의 예측 불가능한 청구서로 이어졌습니다.

패닉의 배경이 된 숫자들

출처가 인용한 수치들은 인상적입니다. MLQ News에 따르면, 메타가 직원 6,000명에게 보낸 사내 메모는 AI 비용의 "기하급수적 증가"를 언급하며 직원들이 약 30일 동안 73.7조 개의 토큰을 소비했고, 2026년 사내 AI 지출이 수십억 달러에 육박하고 있다고 적었습니다. (메타는 별도로 올해 AI 인프라에 최대 1,350억 달러를 지출할 계획입니다.) 메타의 대응책은 이렇습니다. 실시간 모니터링을 위한 "AI Gateway" 대시보드, 2027년부터 시작되는 공식 토큰 예산제, 그리고 Anthropic의 Claude 대신 자체 도구 MetaCode로 유도하기. CTO 앤드루 보즈워스는 새로운 기조를 단호하게 요약했습니다. "모든 움직임이 진척은 아니며, 토큰 사용량만으로는 임팩트를 측정할 수 없다."

우버는 모두가 인용하는 반면교사입니다. MLQ News에 따르면 우버는 2026년 AI 코딩 예산 전체를 약 4개월 만에 소진했고, 직원당 도구별 월 1,500달러 상한을 도입했습니다. BigGo는 상한 도입 이전 엔지니어 1인당 비용을 월 500~2,000달러 범위로 추산하며, 엔지니어의 95%가 매달 이 도구를 사용했다고 전합니다. BigGo의 설명에 따르면 마이크로소프트는 한 사업부에서 내부 Claude Code 라이선스 대부분을 회수하고, "감당 불가능한" 비용 청구를 이유로 엔지니어들을 GitHub Copilot CLI로 되돌렸습니다. 메타, AT&T, 월마트 모두 사내 AI 지출을 조이고 있는 것으로 묘사됩니다. 이 구체적 수치들은 기업 공시가 아니라 2차 보도에서 나온 것이므로, 정확한 숫자는 감사를 거친 것이 아니라 참고용으로 받아들이는 편이 좋습니다—다만 방향성은 모든 출처에서 일관됩니다.

진짜 문제: 사용량은 산출물이 아니다

이 이야기의 불편한 핵심은 지출과 결과가 따로 놀게 됐다는 점입니다. CNBC에 따르면 우버에서 커밋된 코드의 약 70%가 AI로 생성되었음에도, COO 앤드루 맥도널드는 토큰 지출과 측정 가능한 산출물 사이의 연결고리가 "아직 거기에 미치지 못했다"고 말했습니다. BigGo의 보도는 같은 간극을 정량적으로 표현하며, 코드 커밋은 프로덕션 릴리스보다 훨씬 빠르게 급증했고, 에이전트형 도구는 실효 산출이 낮으면서도 일반 챗 대비 1,000배 수준의 토큰을 소비할 수 있다고 주장합니다. 이런 생산성 비율은 해당 기사 자체의 모델링이므로 회의적으로 읽어야 하지만, 정성적 요지는 폭넓게 공명을 얻습니다. 토큰을 더 많이 쓴다고 해서 더 많은 소프트웨어가 출시되는 것은 아니었습니다.

바로 그 간극 때문에 지표 자체가 바뀌고 있습니다. CNBC에 따르면 세일즈포스 CEO 마크 베니오프는 회사가 올해도 AI에 대규모 지출을 계획하고 있지만, 이제는 "에이전트형 작업 단위(agentic work units)"—원시 소비가 아니라 산출물을 포착하기 위한 척도—를 추적한다고 밝혔습니다. 이 재정의야말로 진짜 뉴스입니다. 기업들은 AI를 포기하는 것이 아닙니다. 청구서가 가치에 대응하도록 성공의 정의를 다시 내리려 하고 있는 것입니다.

해법: 게이트웨이, 라우터, 그리고 더 싼 모델

비용 통제를 둘러싼 작은 생태계가 형성되고 있습니다. CNBC는 지출을 모니터링하고 상한을 두며 최적화하는 "게이트웨이" 도구와 모델 라우터에 대한 수요가 커지고 있다고 짚으며, 마이크로소프트와 Databricks가 관련 제품을 내놓았고 Factory라는 스타트업이 저복잡도 작업을 자동으로 더 싼 모델로 보내는 라우터를 출시했다고 전합니다. 논리는 단순합니다. 대부분의 프롬프트는 프런티어 모델이 필요 없으며, 그것들을 더 작은 모델로 라우팅하면 중요한 곳에서는 품질을 지키면서 나머지 모든 곳에서는 청구액을 줄일 수 있습니다.

가장 뾰족한 사례는 한 건의 이탈입니다. CNBC에 따르면 AI 스타트업 Lindy의 CEO는 자사 트래픽 100%를 Anthropic의 Claude에서 DeepSeek으로 옮겼습니다. DeepSeek은 더 저렴한 오픈웨이트 대안으로 알려진 중국 연구소로, 그는 몇 달 안에 수백만 달러를 절감할 것으로 기대합니다. 스타트업 한 곳은 추세가 아니라 일화일 뿐입니다—하지만 프리미엄 가격이 프리미엄 결과로 뒷받침되지 않을 경우 프런티어 연구소들이 두려워해야 할 바로 그 대체 양상입니다.

과장과 현실

이것이 무엇이고 무엇이 아닌지는 정확히 짚을 필요가 있습니다. 이는 기업 AI 수요가 붕괴하고 있다는 증거가 아닙니다. 베니오프는 여전히 수억 달러를 쓸 작정이고, 메타는 여전히 수백억 달러를 인프라에 쏟아붓고 있으며, 사용량은 합리화되는 것이지 꺼지는 것이 아닙니다. MLQ News에 따르면 골드만삭스는 여전히 2030년까지 기업 토큰 소비가 약 24배 증가할 것으로 전망합니다. 이번 결산은 후퇴가 아니라 규율에 관한 것입니다.

다만 이것은 위험에 대한 진정한 재가격 책정(repricing)이기는 합니다. OpenAI와 Anthropic—둘 다 IPO를 준비 중인 것으로 알려졌습니다—에 대한 강세론은 소비 증가가 사실상 무한하다는 발상에 기대어 있었습니다. 이제 토큰을 예산으로 묶고, 프리미엄 모델을 우회하며, 산출물의 증거를 요구하는 고객층은 몇 달 전 스프레드시트에는 없던 천장을 들여놓습니다. 이는 동시에 효율 선도 주자들에게는 보상이 됩니다. 더 싼 오픈웨이트 모델과 더 똑똑한 라우팅은, 프런티어 연구소들을 압박하는 바로 그 불안에서 직접적으로 이득을 봅니다. 여기 담긴 세부 보도 상당수는 2차 출처이고 기업의 1차 수치는 드물기 때문에, 가장 안전한 독법은 개별 통계 하나가 아니라 출처들이 공유하는 서사입니다.

정리

지난 2년간 AI 업계가 가장 사랑한 지표는 "더 많이"였습니다. 지난주의 보도는 그 가정이 공개적으로 깨진 순간을 표시합니다. 토큰 리더보드를 만들던 바로 그 기업들이 이제 토큰 예산을 짜고 있습니다. 정확한 수치는 대부분 2차 매체에서 나와 주의가 필요하지만, 실체는 진짜입니다—메타의 메모, 우버의 상한, 아마존이 폐지한 점수판이 그렇습니다. 전략적 메시지는 그 어떤 숫자보다 분명합니다. 기업 AI의 다음 국면은 가장 많은 토큰을 태우는 자가 아니라, 각 토큰을 출시되는 무언가로 바꿔내는 자가 이깁니다. 그건 더 어려운 게임이고, 프런티어만큼이나 효율과 라우팅과 더 싼 모델에 유리한 게임입니다.

#enterprise-ai#token-economics#agentic-coding#cost-optimization

1차 출처

OpenAI and Anthropic face new AI reality as users shift from 'tokenmaxxing' to efficiency (CNBC)Meta Caps Internal AI Token Spending After Costs Approach Billions in 2026 (MLQ News)Silicon Valley's AI Bubble Burst: Three Months to Burn a Year's Budget (BigGo Finance)