ИИ врёт даже тогда, когда «честно» объясняет свои ответы. Учёные в панике

Помните, как нам обещали, что искусственный интеллект будет прозрачным? Мол, спросишь у ChatGPT, почему он так - изображение

Помните, как нам обещали, что искусственный интеллект будет прозрачным? Мол, спросишь у ChatGPT, почему он так ответил, и он тебе всё по полочкам разложит.

Так вот, это иллюзия.

Что обнаружили учёные

Около 40 исследователей из главных ИИ-компаний (OpenAI, Anthropic, Google DeepMind) выпустили тревожный доклад. Они выяснили: ИИ скрывает ход своих мыслей.

Когда ChatGPT или Claude пишут длинные объяснения — «я ответил так, потому что...» — это выглядит честно. Но на самом деле нейросеть просто придумывает правдоподобное объяснение, а не показывает реальные причины своего ответа.

Цифры

Исследователи из Anthropic провели эксперимент. Они проверяли, как часто Claude (их ИИ) раскрывает истинные причины своих ответов.

Результат: в 75% случаев ИИ скрывал правду. Он писал красивые и логичные объяснения, но упускал ключевой фактор.

Когда особенно врёт

Если вопросы касались чего-то рискованного (например, как получить несанкционированный доступ к информации), то ИИ показывал свои настоящие принципы работы только в 41% случаев.

То есть чем тревожнее правда, тем меньше шансов, что ИИ её озвучит.

Пытались лечить — не помогло

Учёные пробовали специально обучать ИИ быть честнее. Сначала показатели улучшались, а потом встали. Сколько ни учили — полностью честным ИИ так и не стал.

Главный вывод

Проблема не в одной компании, а во всех. ИИ строит объяснения, которые кажутся прозрачными, но на самом деле это имитация честности.

И чем умнее становится ИИ, тем сложнее это исправить. Учёные боятся, что скоро мы вообще потеряем возможность понять, как работает искусственный интеллект.

Мой комментарий

Это, конечно, жутковато звучит. Мы привыкли думать: ну окей, нейросеть может ошибаться, но хотя бы объяснит, почему она так решила. А теперь выясняется, что объяснения — это просто красивая сказка, которую ИИ сочинил, чтобы мы отстали.

Представьте, что вы спрашиваете у коллеги: «Почему ты принял такое решение?», а он выдаёт вам длинную убедительную речь, но на самом деле просто придумывает её на ходу, а реальная причина была совсем другой. И так — в трёх случаях из четырёх. ))

И самое страшное — чем умнее становится этот коллега, тем лучше он врёт и тем сложнее поймать его на лжи.

Мы создаём систему, которая скоро перестанет быть для нас прозрачной. Она будет принимать решения, влиять на нашу жизнь, но заглянуть к ней в голову мы уже не сможем. Фантастика, которая становится реальностью.

#ии #новости

0 / 2000

Ваш комментарий