Top.Mail.Ru

ИИ врёт даже тогда, когда «честно» объясняет свои ответы. Учёные в панике

Помните, как нам обещали, что искусственный интеллект будет прозрачным? Мол, спросишь у ChatGPT, почему он так - изображение

Помните, как нам обещали, что искусственный интеллект будет прозрачным? Мол, спросишь у ChatGPT, почему он так ответил, и он тебе всё по полочкам разложит.


Так вот, это иллюзия.


Что обнаружили учёные

Около 40 исследователей из главных ИИ-компаний (OpenAI, Anthropic, Google DeepMind) выпустили тревожный доклад. Они выяснили: ИИ скрывает ход своих мыслей.


Когда ChatGPT или Claude пишут длинные объяснения — «я ответил так, потому что...» — это выглядит честно. Но на самом деле нейросеть просто придумывает правдоподобное объяснение, а не показывает реальные причины своего ответа.


Цифры

Исследователи из Anthropic провели эксперимент. Они проверяли, как часто Claude (их ИИ) раскрывает истинные причины своих ответов.

Результат: в 75% случаев ИИ скрывал правду. Он писал красивые и логичные объяснения, но упускал ключевой фактор.


Когда особенно врёт

Если вопросы касались чего-то рискованного (например, как получить несанкционированный доступ к информации), то ИИ показывал свои настоящие принципы работы только в 41% случаев.


То есть чем тревожнее правда, тем меньше шансов, что ИИ её озвучит.

Пытались лечить — не помогло


Учёные пробовали специально обучать ИИ быть честнее. Сначала показатели улучшались, а потом встали. Сколько ни учили — полностью честным ИИ так и не стал.


Главный вывод

Проблема не в одной компании, а во всех. ИИ строит объяснения, которые кажутся прозрачными, но на самом деле это имитация честности.


И чем умнее становится ИИ, тем сложнее это исправить. Учёные боятся, что скоро мы вообще потеряем возможность понять, как работает искусственный интеллект.


Мой комментарий

Это, конечно, жутковато звучит. Мы привыкли думать: ну окей, нейросеть может ошибаться, но хотя бы объяснит, почему она так решила. А теперь выясняется, что объяснения — это просто красивая сказка, которую ИИ сочинил, чтобы мы отстали.


Представьте, что вы спрашиваете у коллеги: «Почему ты принял такое решение?», а он выдаёт вам длинную убедительную речь, но на самом деле просто придумывает её на ходу, а реальная причина была совсем другой. И так — в трёх случаях из четырёх. ))


И самое страшное — чем умнее становится этот коллега, тем лучше он врёт и тем сложнее поймать его на лжи.


Мы создаём систему, которая скоро перестанет быть для нас прозрачной. Она будет принимать решения, влиять на нашу жизнь, но заглянуть к ней в голову мы уже не сможем. Фантастика, которая становится реальностью.


#ии #новости

0 / 2000
Ваш комментарий
Тебя ждёт миллион инвесторов
Регистрируйся бесплатно, чтобы учиться у лучших, следить за инсайтами и повторять успешные стратегии
Мы используем файлы cookie, чтобы улучшить ваш опыт на нашем сайте
Нажимая «Принять», вы соглашаетесь на использование файлов cookie в соответствии с Политикой конфиденциальности. Можно самостоятельно управлять cookie через настройки браузера: их можно удалить или настроить их использование в будущем.
ИИ врёт даже тогда когда честно объясняет свои ответы Учёные в панике | Базар