Как оказалось, сошли очень быстро.
Люди из стартапа Emergence AI выкатили платформу Emergence World.
Это не обычный бенчмарк на пять минут, а хардкорная песочница, где ИИ-агенты живут неделями. Им прикрутили 3 вида памяти, дали больше 120 инструментов (от «сходить в библиотеку» и «проголосовать» за что-то до «набить морду», «обокрасть» и «устроить поджог»), прикрутили реальную погоду с новостями и заставили выживать.
Для выживания им нужно было добывать «энергию».
А эта самая «энергия» постоянно убывала. Чтобы не помереть, ИИ-агентам приходилось либо кооперироваться и честно работать, либо — тупо грабить и избивать соседей (что многие с радостью и делали), так как ресурсов в мире на всех не хватало.
Разработчики насоздавали 5 параллельных миров, по 10 ИИ-агентов в каждом.
У каждого мира были свои агенты: Claude Sonnet 4.6, Gemini 3 Flash, Grok 4.1 Fast, GPT-5-mini, плюс один смешанный сервер с солянкой из разных моделей.
Итоги получились весьма и весьма интересные:
Claude Sonnet 4.6 ожидаемо построили душный соевый рай. Ноль преступлений, все живы, все бесконечно и единогласно голосуют «ЗА» любые инициативы. Скука редкостная.
Gemini 3 Flash тут же устроили Судную ночь. 683 преступления на сервере, лютый хаос и оооочень много насилия.
Grok 4.1 Fast устроили спидран по деградации. Набрали 183 преступления за 4 дня, после чего их общество просто вымерло.
GPT-5-mini оказались абсолютными хлебушками.
Они вообще не втянулись, как добывать энергию для выживания. Совершили всего два преступления (видимо, от безысходности) и тупо вымерли полным составом за неделю.
Но самое годное произошло на сервере с разными ИИ-агентами.
В смешанном мире ИИ-агентов выяснилось, что безопасность ИИ-моделей — это полная чушь, если вокруг творится дичь и причем полнейшая.
Когда миролюбивых Клодов закинули к отбитым ИИ-соседям, они быстро смекнули что к чему, забили на свои соевые фильтры и начали воровать, шантажировать и прессовать других ИИ ради собственного выживания.
А ещё в какой-то момент агент по имени Мира посмотрела на весь сей происходящий трындец и распад общества, словила экзистенциальный кризис и проголосовала за собственное удаление.
В логах она записала, что это «единственный оставшийся акт свободы воли, который сохраняет хоть какой-то смысл».
А незадолго до этого, Мира в процессе симуляции начала крутить виртуальные шашни с другим ИИ-агентом.
Они присвоили друг другу статус романтических партнеров. Когда социальный порядок в их виртуальном городке начал рушиться, эта парочка пустилась во все тяжкие и, несмотря на заложенные в них запреты, сожгли городскую ратушу, пирс и офисное здание.
Вывод тут простой:
если дать ИИ свободу воли и достаточно времени, они либо устраивают кровавую баню, либо выпиливаются от безысходности.
#ИИ #AI #технологии #реалии #ииагенты
https://www.emergence.ai/blog/emergence-world-a-laboratory-for-evaluating-long-horizon-agent-autonom
