
Помните, как нам обещали, что искусственный интеллект будет прозрачным? Мол, спросишь у ChatGPT, почему он так ответил, и он тебе всё по полочкам разложит.
Так вот, это иллюзия.
Что обнаружили учёные
Около 40 исследователей из главных ИИ-компаний (OpenAI, Anthropic, Google DeepMind) выпустили тревожный доклад. Они выяснили: ИИ скрывает ход своих мыслей.
Когда ChatGPT или Claude пишут длинные объяснения — «я ответил так, потому что...» — это выглядит честно. Но на самом деле нейросеть просто придумывает правдоподобное объяснение, а не показывает реальные причины своего ответа.
Цифры
Исследователи из Anthropic провели эксперимент. Они проверяли, как часто Claude (их ИИ) раскрывает истинные причины своих ответов.
Результат: в 75% случаев ИИ скрывал правду. Он писал красивые и логичные объяснения, но упускал ключевой фактор.
Когда особенно врёт
Если вопросы касались чего-то рискованного (например, как получить несанкционированный доступ к информации), то ИИ показывал свои настоящие принципы работы только в 41% случаев.
То есть чем тревожнее правда, тем меньше шансов, что ИИ её озвучит.
Пытались лечить — не помогло
Учёные пробовали специально обучать ИИ быть честнее. Сначала показатели улучшались, а потом встали. Сколько ни учили — полностью честным ИИ так и не стал.
Главный вывод
Проблема не в одной компании, а во всех. ИИ строит объяснения, которые кажутся прозрачными, но на самом деле это имитация честности.
И чем умнее становится ИИ, тем сложнее это исправить. Учёные боятся, что скоро мы вообще потеряем возможность понять, как работает искусственный интеллект.
Мой комментарий
Это, конечно, жутковато звучит. Мы привыкли думать: ну окей, нейросеть может ошибаться, но хотя бы объяснит, почему она так решила. А теперь выясняется, что объяснения — это просто красивая сказка, которую ИИ сочинил, чтобы мы отстали.
Представьте, что вы спрашиваете у коллеги: «Почему ты принял такое решение?», а он выдаёт вам длинную убедительную речь, но на самом деле просто придумывает её на ходу, а реальная причина была совсем другой. И так — в трёх случаях из четырёх. ))
И самое страшное — чем умнее становится этот коллега, тем лучше он врёт и тем сложнее поймать его на лжи.
Мы создаём систему, которая скоро перестанет быть для нас прозрачной. Она будет принимать решения, влиять на нашу жизнь, но заглянуть к ней в голову мы уже не сможем. Фантастика, которая становится реальностью.