В апреле-мае 2026 года из крупных tech-корпораций США начала просачиваться неприятная информация. Сотрудники массово занимаются практикой, которую назвали "tokenmaxxing".
Что это такое. Корпорации поставили KPI: сотрудники должны использовать ИИ. В Amazon 80 процентов разработчиков обязаны использовать ИИ еженедельно. В Meta(Запрещенной в РФ) создали внутренний рейтинг "Claudeonomics" по объёму потраченных токенов. В Microsoft аналогичные требования.
Результат предсказуемый. Сотрудники начали запускать ИИ-агенты на бессмысленные задачи, чтобы попасть в верхушку рейтингов и сохранить рабочие места.
Цифры по The Information и Inc.com.
Один сотрудник Meta среднее за месяц потратил 281 миллиард токенов. По ценам API Anthropic это сотни тысяч долларов на одного человека.
Сотрудники Meta совокупно за 30 дней потратили 60.2 триллиона токенов. По ценам Anthropic это 900 миллионов долларов. Meta наверняка покупает токены со скидкой, но реальная стоимость всё равно более 100 миллионов в месяц.
После общественной реакции в социальных сетях Meta закрыла внутренний рейтинг. Но привычка не исчезла.
В Amazon, как сообщает TechRadar со ссылкой на Financial Times, разработчики запускают внутренний агент MeshClaw на любые задачи только для того чтобы поднять свой счётчик использования. Один сотрудник прямо признался: "Мне всё равно есть смысл в задаче или нет, главное чтобы счётчик рос."
Microsoft, по сообщению Fortune от 22 мая 2026, сворачивает часть своих ИИ-инициатив. Причина: затраты на токены превысили ожидания, а ROI не подтверждается.
Теперь о фундаментальной проблеме.
По исследованию Stanford Digital Economy Lab от 2026 года, агентные задачи потребляют в 1000 раз больше токенов чем обычное использование ИИ-моделей в режиме чат-бота.
Не в 10. Не в 100. В 1000 раз.
Причина в архитектуре. Когда агент выполняет задачу, он перечитывает весь контекст перед каждым следующим шагом. Шаг 1, читается исходный промт. Шаг 2, читается исходный промт плюс результат шага 1. Шаг 3, исходный плюс шаг 1 плюс шаг 2. Контекст растёт как снежный ком. Стоимость растёт квадратично.
Питер Штайнбергер, создатель популярного агента OpenClaw, публично признался что тратит 1.3 миллиона долларов в месяц на токены для одной команды разработчиков. Источник: vc.ru. И это не аномалия, это норма для агентов с классической архитектурой.
По данным 24/7 Wall St и Jon Krohn Research, совокупные капитальные вложения четырёх гигантов (Amazon, Microsoft, Alphabet, Meta) в 2026 году достигнут 725 миллиардов долларов. Большинство этих денег идёт в ИИ-инфраструктуру для обслуживания именно такого расходования токенов.
Goldman Sachs прогнозирует 24-кратный рост потребления токенов к 2030 году. Это означает что текущая проблема будет нарастать, а не убывать.
Цена за токен снижается, но скорость роста потребления опережает удешевление. Gartner прогнозирует снижение стоимости инференса на 90 процентов к 2030 году. Но если потребление вырастет в 1000 раз, общие затраты всё равно вырастут на порядок.
Что это означает.
Корпоративный подход к ИИ-агентам построен на архитектуре, которая математически не масштабируется. Чем дольше работает агент, тем дороже стоит каждая дополнительная минута его работы. Это не bug, это feature архитектуры.
Альтернатива есть. Это структурированные workflow с декомпозицией задачи на чёткие шаги, фокусированным контекстом на каждом шаге и явным результатом, который не требует перечитывания.
В VibePilot используется именно такой подход с осени 2025 года. Один проект в виртуальной команде стоит 200-500 токенов вместо миллиардов. Не потому что у них лучше модель. А потому что у них другая архитектура.
Главный вопрос для индустрии не "сколько ещё миллиардов вложить". А "когда крупные игроки поймут что архитектура важнее бюджета".
Пока не поймут, у них есть проблема. У нас есть преимущество.
