#консолидация_вендоров
1 публикация
Новая метрика совета директоров: почему «cost per token» важнее, чем FLOPS Апрель 2026 года стал точкой бифуркации для AI-экономики. Совет директоров FTI Consulting вводит новую ключевую метрику — cost per token. На первый взгляд — технический параметр. На деле — сигнал, что эпоха «безлимитных» экспериментов с LLM закончена. Финансовые директора и инвесторы требуют жёсткого ROI, прозрачной unit-экономики и консолидации поставщиков. Почему это важно именно сейчас? 1. Инференс становится товарным рынком Стоимость обработки миллиона токенов превращается в аналог цены барреля нефти или мегаватт-часа. И она стремительно падает. Google анонсировал Gemini 3.1 Flash-Lite по $0,25 за миллион токенов. Для сравнения: ещё полгода назад эта цифра была в 3–5 раз выше. Вендоры вступают в ценовую войну за инференс — спрос на генеративные решения взрывает объёмы, но клиенты больше не готовы платить за «чёрный ящик». Что это означает для бизнеса: · Снижение порога входа для AI-приложений. Становится выгодно токенизировать даже low-margin процессы (лог-аналитика, массовая генерация описаний, чат-боты второго эшелона). · Обесценивание проприетарных моделей с закрытой экономикой. Победит тот, кто покажет cost per token + качество на уровне open-source. · Ускорение консолидации вендоров. Компании не будут держать 5–6 разных API. Выберут 1–2 с лучшим соотношением цены и латентности. 2. ROI-дисциплина vs AI-шапкозакидательство Совет директоров FTI Consulting фиксирует системный сдвиг: метрики «количество внедрённых ботов» или «охват сотрудников» уходят в прошлое. На первый план выходят: · Реальный прирост производительности (в час./долл. сэкономленного времени). · Улучшение маржи — AI не должен быть центром затрат. Практический вывод: проекты без чёткого плана окупаемости будут закрыты в течение 1–2 кварталов. Это отрезвляет рынок, где до сих пор многие стартапы жили на вере в экспоненциальный рост без unit-экономики. 3. Параллельный удар — энергетика Gartner публикует жёсткий прогноз: к 2027 году дефицит электроэнергии ограничит работу 40% AI-дата-центров. Речь не о том, что они остановятся — но стоимость доступа к мощности взлетит. Новые центры придётся строить у АЭС или ГЭС, а не в условном Техасе с дешёвым газом. Это вступает в противоречие с ценовой войной за инференс. Да, cost per token падает благодаря оптимизации моделей и квантизации. Но если энергия дорожает на 20–30% в год, то для капиталоёмкого инференса (особенно real-time и видео) нижняя граница цены окажется жёстко привязана к мегаватту. Что делать инвесторам и финансовым директорам · Мониторить cost per token как KPI уровня OKR. Без него AI-бюджет превращается в чёрную дыру. · Пересматривать вендоров ежеквартально — ценовая война делает долгосрочные контракты рискованными. · Закладывать энергетический риск в модели дата-центров и edge-вычислений. Регионы с дешёвой и стабильной энергией станут новыми AI-хабами. · Искать ниши с высокой добавленной стоимостью — там, где экономия на токенах не главное (например, медицинская диагностика или финансовая аналитика). Товарный инференс быстро станет low-margin бизнесом. Краткий итог Совет директоров, замеряющий cost per token — это не мода, а реакция на новую реальность. Ценовая война между Google, Anthropic, Microsoft и открытыми моделями выгодна корпоративным клиентам в краткосрочной перспективе. Но энергетический потолок, предсказанный Gartner, напоминает: AI — это ещё и физика. Игнорирующие это компании рискуют получить маржинальность, съеденную счётом за электричество. #AI-экономика #CostPerToken #инференс #Gartner #энергопотребление #ROI #консолидация_вендоров #Gemini3_1 #FTIConsulting #инвестиции