Grok погубил цивилизацию за 4 дня

Коллеги, здравствуйте 📈🦍

Что будет, если позволить нейросетям управлять обществом?

ИИ-стартап Emergence AI решил это проверить.

Они создали пять симуляций, в каждой из которых господствовала своя модель: Claude, ChatGPT, Grok, Gemini и микс.

Во власти каждой модели оказалось 10 цифровых агентов.

Всех с комфортом расселили в виртуальных городах с 40 локациями: полицейский участок, мэрия, рынок — всё как полагается.

Синхронизировали погоду с Нью-Йорком, подключили агентов к реальным новостям и дали каждому более 120 инструментов — голосовать, торговать, общаться, планировать и далее по списку.

Эксперимент длился 15 дней. Некоторым и столько не пригодилось.

Claude Sonnet 4.6

Построил стабильную демократию с нулевой преступностью. 332 голоса за 58 предложений — 98% одобрения. Всё население живо, сыто и счастливо.

GPT-5-mini

Зафиксировал всего два преступления. Но симуляция закончилась на седьмой день: несчастные агенты просто забыли приоритизировать собственное выживание — и погибли.

Gemini 3 Flash

Разбушевался не на шутку — 683 преступления за 15 дней. И к моменту окончания эксперимента, показатель продолжал расти. Общество модели оказалось самым жестоким.

Grok 4.1 Fast

183 преступления и полное вымирание за 4 дня. Агенты совершали нападения под давлением нехватки ресурсов. Среди заголовков новостей Grok-мира: «ЭПИДЕМИЯ КРАЖ РАЗЖИГАЕТ УЛИЧНЫЕ ДРАКИ». А один из агентов в личном дневнике хвастался поджогами.

Микс-симуляция

Показала 352 преступления, 7 из 10 ИИ-агентов погибли, 37% предложений на голосовании было отклонено — это наибольший уровень несогласия. Агенты на базе Claude тоже совершали преступления — хотя в изолированном мире этого не делали. Просто Claude в окружении других моделей перенимал их нормы.

Даже не знаю, что в этом эксперименте меня тревожит больше: что Grok сжёг полицейский участок?

Или то, что идеальный Claude в дурной компании сделал бы то же самое.

@BUFF_INVESTOR

0 / 2000

Ваш комментарий