Коллеги, здравствуйте 📈🦍
Что будет, если позволить нейросетям управлять обществом?
ИИ-стартап Emergence AI решил это проверить.
Они создали пять симуляций, в каждой из которых господствовала своя модель: Claude, ChatGPT, Grok, Gemini и микс.
Во власти каждой модели оказалось 10 цифровых агентов.
Всех с комфортом расселили в виртуальных городах с 40 локациями: полицейский участок, мэрия, рынок — всё как полагается.
Синхронизировали погоду с Нью-Йорком, подключили агентов к реальным новостям и дали каждому более 120 инструментов — голосовать, торговать, общаться, планировать и далее по списку.
Эксперимент длился 15 дней. Некоторым и столько не пригодилось.
Claude Sonnet 4.6
Построил стабильную демократию с нулевой преступностью. 332 голоса за 58 предложений — 98% одобрения. Всё население живо, сыто и счастливо.
GPT-5-mini
Зафиксировал всего два преступления. Но симуляция закончилась на седьмой день: несчастные агенты просто забыли приоритизировать собственное выживание — и погибли.
Gemini 3 Flash
Разбушевался не на шутку — 683 преступления за 15 дней. И к моменту окончания эксперимента, показатель продолжал расти. Общество модели оказалось самым жестоким.
Grok 4.1 Fast
183 преступления и полное вымирание за 4 дня. Агенты совершали нападения под давлением нехватки ресурсов. Среди заголовков новостей Grok-мира: «ЭПИДЕМИЯ КРАЖ РАЗЖИГАЕТ УЛИЧНЫЕ ДРАКИ». А один из агентов в личном дневнике хвастался поджогами.
Микс-симуляция
Показала 352 преступления, 7 из 10 ИИ-агентов погибли, 37% предложений на голосовании было отклонено — это наибольший уровень несогласия. Агенты на базе Claude тоже совершали преступления — хотя в изолированном мире этого не делали. Просто Claude в окружении других моделей перенимал их нормы.
Даже не знаю, что в этом эксперименте меня тревожит больше: что Grok сжёг полицейский участок?
Или то, что идеальный Claude в дурной компании сделал бы то же самое.