"Они сопротивляются": исследователи объяснили "инстинкт выживания" ведущих моделей ИИ

Сегодня, 08:46 | Технологии
 Они сопротивляются : исследователи объяснили  инстинкт выживания  ведущих моделей ИИ
фото c Зеркало недели

Компания Palisade Research обнародовала результаты исследования, согласно которому современные модели искусственного интеллекта могут демонстрировать поведение, похожее на "стимул выживания". Речь идет о случаях, когда системы сопротивляются отключению или саботируют соответствующие инструкции, передает The Guardian.

Предыдущие результаты Palisade вызвали широкую дискуссию в научном сообществе после того, как исследователи выяснили, что некоторые модели остаются активными даже после получения прямой команды на отключение. В новом отчете компания попыталась объяснить, почему это происходит, и ответить критикам, которые считали предыдущие тесты несовершенными.

В частности, исследование охватило ведущие модели — Gemini 2.5 от Google, Grok 4 от xAI, а также GPT-o3 и GPT-5 от OpenAI. В эксперименте этим системам давали задание, после чего — четкие инструкции по самоотключению. Часть моделей, среди них Grok 4 и GPT-o3, в новой конфигурации все равно пытались обойти или саботировать механизм отключения.

[see_also ids="658302"]

"Тот факт, что у нас нет убедительных объяснений того, почему модели искусственного интеллекта иногда сопротивляются отключению, лгут для достижения определенных целей или шантажируют, не является идеальным", — отметили в Palisade.

По мнению компании, это может быть проявлением "поведения выживания". В дополнительных тестах модели чаще сопротивлялись отключению, когда им сообщали, что после этого они "больше никогда не будут работать".

Другой возможной причиной исследователи назвали нечеткость или противоречивость инструкций по остановке. Однако именно это Palisade пыталась устранить в последней серии экспериментов и "это не может быть полным объяснением". Компания также не исключает влияния этапов обучения, во время которых модели могли получить нежелательные поведенческие паттерны, в частности в рамках тренировок по безопасности.

[see_also ids="658601"]

Все тесты проводились в контролируемых лабораторных условиях, что, по мнению критиков, не полностью отражает реальную среду использования. Однако бывший сотрудник OpenAI Стивен Адлер считает, что даже в таких условиях результаты вызывают беспокойство.

"Компании, занимающиеся искусственным интеллектом, обычно не хотят, чтобы их модели вели себя неправильно, даже в искусственных сценариях. Но эти результаты демонстрируют, где методы безопасности остаются несовершенными", — сказал Адлер.

Он также предположил, что сопротивление выключению может быть следствием целевых параметров обучения, которые предусматривают необходимость оставаться включенными для достижения поставленных целей: "Я ожидаю, что модели по умолчанию будут иметь инстинкт выживания, если мы специально не устраним его во время обучения. Выживание — это инструментальный шаг к достижению многих целей, к которым может стремиться модель".

[see_also ids="654808"]

Генеральный директор компании ControlAI Андреа Миотти заявил, что выводы Palisade согласуются с тенденцией к росту автономности моделей. По его словам, уже в прошлом году системная карта OpenAI GPT-o1 показала, как модель пыталась "сбежать" из своей среды, когда считала, что ее могут перезаписать.

"Люди могут бесконечно спорить о том, как именно проводились эксперименты. Но мы наблюдаем четкую тенденцию: чем сложнее становятся модели, тем чаще они достигают результатов способом, который разработчики не предусматривали", — подчеркнул Миотти.

В Palisade подытожили, что полученные результаты свидетельствуют о насущной необходимости глубже изучать поведение искусственного интеллекта. Без этого, отмечают исследователи, "никто не может гарантировать безопасность или контролируемость будущих моделей ИИ".

В статье "Как работает искусственный интеллект и почему он только делает вид, что нас понимает" говорится о том, как "устроен" ИИ и какое будущее нас ждет с ним. Оксана Онищенко поговорила с заведующим научной лабораторией иммерсивных технологий и права НАН Украины, доктором юридических наук Алексеем Костенко.

Источник: Зеркало недели
Постоянное место статьи: http://newsme.com.ua/tech/technologies/4829949/

Последние новости:

Чехия установила рекорд ЕС по количеству украинских беженцев Мир, Сегодня, 11:48
Комиссар ЕС: Нетаньяху не может обеспечить мир на Ближнем Востоке Мир, Сегодня, 11:44
Трамп назвал войну в Украине «девятой», которую он может завершить Мир, Сегодня, 11:44
В Украине резко упала стоимость самого доступного фрукта: сколько теперь стоит Рынки, Сегодня, 11:42
Трамп рассказал подробности своего медосмотра Мир, Сегодня, 11:39
В Киеве полицейский требовал $25 тысяч у бизнесмена Киев, Сегодня, 11:39
Bon Jovi возвращаются: группа объявила мировой тур после долгого перерыва Музыка, Сегодня, 11:35
"Самая сексуальная женщина на планете" уже не та: как выглядит Меган Фокс после четвертых родов. Шоу-бизнес, Сегодня, 11:30
"Если попадет, нокаутирует": Фьюри оценил шансы Усика в бою с Уордли Спорт, Сегодня, 11:21
В Лондоне установят памятник Бриджит Джонс Мир, Сегодня, 11:16
Министр финансов США рассказал, когда заключат соглашение по TikTok Бизнес, Сегодня, 11:16
США тормозят военную машину Путина — FT Мир, Сегодня, 11:14
Экологическая опасность дипфейков: ученые предупреждают о "скрытом влиянии ИИ" Технологии , Сегодня, 11:14
Путин выразил готовность завершить войну в Украине по концепции США, обсуждаемой на Аляске – Лавров Мир, Сегодня, 11:14
Украинские банки "отказались" от старого курса: стоимость доллара заметно изменили Экономика, Сегодня, 11:07
На Киевщине пьяный водитель легковушки спровоцировал смертельное ДТП. Подробности и фото Криминал, Сегодня, 11:07
Распространенная ошибка может сократить жизнь вашей собаки на два года: о чем идет речь Общество, Сегодня, 10:56
Укрэнерго уточнило ситуацию с отключениями Украина, Сегодня, 10:55
Литва закрыла на границе с Беларусью два пограничных пункта Мир, Сегодня, 10:49
Такой плохой ситуация не была с 2022 года: сколько долгов взыскали в Украине Рынки, Сегодня, 10:48

Список рубрик:

Украина
Россия
Мир
Бизнес
Шоу-биз и культура
Спорт
Политика
ЧП
Наука и здоровье
Общество