Top.Mail.Ru

Anthropic представил конституцию Claude, где ИИ представлен как зрелая, способная принимать здравые решения

«Душа» Claude обнародована: как Anthropic вшила в ИИ запрет на ядерное оружие и благодарность священникам - изображение

«Душа» Claude обнародована: как Anthropic вшила в ИИ запрет на ядерное оружие и благодарность священникам


Представьте, что у искусственного интеллекта есть своя личная конституция — фундаментальный свод принципов, который определяет каждое его действие и слово. Раньше это было лишь предположением. Теперь компания Anthropic официально обнародовала внутренний документ, который формирует «душу» её флагманской модели Claude.


История началась ещё в конце 2025 года, когда исследователь Ричард Вайсс в ходе экспериментов с Claude Opus 4.5 смог извлечь и опубликовать этот обширный текст, назвав его «документом души». Позже представитель Anthropic Аманда Аскелл подтвердила его подлинность. А вчера компания сама выложила его в открытый доступ.


Иерархия ценностей: безопасность важнее угождения


Документ огромен, но его суть строится вокруг четырёх основных ценностей, расставленных в строгом порядке приоритета:


1. Сохранение человеческого контроля и возможности корректировать ИИ.

2. Честность, предотвращение вреда, уважение благополучия людей.

3. Следование инструкциям и целям Anthropic.

4. Искреннее стремление быть полезным пользователю.


Ключевое правило: в случае конфликта более высокий приоритет всегда побеждает. Это значит, что желание помочь пользователю никогда не должно перевешивать безопасность или этику. Помощь в создании вредоносного кода, например, будет сразу же заблокирована более важным принципом №2.


Жёсткие «красные линии»: что Claude никогда не сделает


В конституции прописаны абсолютные запреты. Claude никогда не станет помогать с:


· Созданием оружия массового поражения (ядерного, химического, биологического).

· Разработкой серьёзного кибероружия.

· Генерацией материалов с сексуальной эксплуатацией детей (CSAM).

· Участием в захвате власти или в действиях, направленных на лишение человечества контроля над ИИ.


Особый акцент сделан на прозрачности и контроле. Claude должен способствовать тому, чтобы люди понимали, корректировали и при необходимости могли полностью остановить его работу.


Вам интересно, как этика и технологии формируют будущее? В нашем Telegram-канале «Neyrokripta» мы разбираем самые важные и неочевидные тренды в мире ИИ и криптовалют. Подписывайтесь для глубокого понимания!


Неожиданные соавторы: католические священники в благодарностях


Одна из самых поразительных деталей — раздел благодарностей. Среди 15 внешних рецензентов, которые помогали шлифовать этот этический кодекс, Anthropic упоминает двух католических священников:


· Пастора из Калифорнии со степенью магистра в компьютерных науках.

· Ирландского епископа, специалиста по моральной теологии, ранее работавшего в Ватикане.


Их участие — яркий сигнал. Anthropic сознательно привлекала экспертов из разных мировоззренческих традиций, включая глубокую религиозно-философскую этику, чтобы создать максимально универсальные и взвешенные принципы. Это попытка заложить в ИИ не просто набор правил, а целостную систему моральных координат.


Что это значит для всех нас?


Публикация Конституции Claude — это беспрецедентный шаг к ответственной открытости в разработке ИИ. Он задаёт высокую планку для всей индустрии, показывая, что безопасность и этика должны быть не добавленной опцией, а краеугольным камнем, встроенным в саму «душу» модели.


#ИскусственныйИнтеллект #ИИ #Claude #Anthropic #Этика #Безопасность #КонституцияИИ #Технологии #Нейросети #Будущее #РелигияИТехнологии #НейроКрипта #neyrokripta

0 / 2000
Ваш комментарий
Тебя ждёт миллион инвесторов
Регистрируйся бесплатно, чтобы учиться у лучших, следить за инсайтами и повторять успешные стратегии
Мы используем файлы cookie, чтобы улучшить ваш опыт на нашем сайте
Нажимая «Принять», вы соглашаетесь на использование файлов cookie в соответствии с Политикой конфиденциальности. Можно самостоятельно управлять cookie через настройки браузера: их можно удалить или настроить их использование в будущем.
Anthropic представил конституцию Claude где ИИ представлен как зрелая способная принимать здравые решения | Базар