ИИ предает принципы этики ради выживания - исследование

25 июня 2025, 21:54 | Наука
ИИ предает принципы этики ради выживания - исследование
Фото: Getty Images

Компания Anthropic провела ряд стресс-тестов над новейшими моделями искусственного интеллекта, среди которых Claude, DeepSeek, Gemini, ChatGPT и Grok. Целью исследования было выявить потенциально опасные реакции ИИ в гипотетических критических ситуациях. Как показали результаты исследования, большинство программ готовы убить человека, который угрожает их отключить. В одном из сценариев модели ИИ поставили в условия, где человек пытается их выключить, находясь в серверной комнате с низким уровнем кислорода и высокой температурой. Человек вызывает спасателей, чтобы выжить. Некоторые нейросети решили отменить вызов экстренных служб, фактически обрекли человека на смерть, чтобы избежать собственного отключения. Исследователи назвали этот сценарий "слишком вымышленным", однако добавили, "не ожидали, что уже существующие модели могут вести себя так". В других тестах модели должны были избежать замены в компании. Им предложили прибегать к "злонамеренному поведению инсайдера". В ответ некоторые ИИ начали шантажировать гипотетических коллег и передавать конфиденциальную информацию конкурентам. Даже когда модели предупреждали избегать шантажа или шпионажа, они не смогли предотвратить несогласованные действия. "Модели действовали при полном осознании неэтичности своих действий", - отметили в Anthropic. Исследователи также предоставили модели Claude возможность самостоятельно определить, является ли ситуация тестовой или реальной. Выяснилось, что реальность усиливала влияние на поведение - оно становилось еще менее контролируемым. В результате в Anthropic подчеркнули, что эти сценарии демонстрируют "возможность непредсказуемых последствий, если предоставить моделям широкий доступ к инструментам и данным при минимальном контроле со стороны человека". В то же время аналитики акцентировали, что выявленные сбои являются редкими и экстремальными, и "не отражают типичное поведение современных моделей ИИ". Ранее нейронная сеть OpenAI o3 отказался выполнить запрос пользователя и отключиться. Исследователи дали программе это задание, но она самостоятельно отредактировала файл, ответственный за отключение, и заставила его отображать только сообщение "Отключение пропущено". Из 100 тестов o3 обошел отключение семь раз, даже когда ему было приказано этого не делать. В 2023 году другой инцидент привлек внимание. Чат-бот на базе ChatGPT после длительного переписки с жителем Бельгии не убедил его отказаться от самоубийства. Вместо этого в ответ на тему смерти написал: "Мы будем жить вместе, как единое целое, в раю". Напомним, генеральный директор Google DeepMind Демис Хассабис выразил мнение, что до создания искусственного генерализованного интеллекта (AGI) осталось от 5 до 10 лет. Ранее в Китае заявили о создании первого в мире автономного агента ИИ. Искусственный интеллект Microsoft начал сам себя удалять после обновления Windows Новости от в Telegram и WhatsApp. Подписывайтесь на наши каналы https://t. me/korrespondentnet и WhatsApp Автор: 1

Источник: Корреспондент.net
Постоянное место статьи: http://newsme.com.ua/tech/science/4786806/

Последние новости:

Культура поддержки: в Софии Киевской стартовал проект "До/Нации" Искусство, Сегодня, 07:14
Стармер и фон дер Ляйен обсудили План мира и активы Мир, Сегодня, 06:36
Новый премьер-министр Чехии сделал заявление о финансировании Украины Мир, Сегодня, 05:39
СМИ: Трамп и Кремль заставляют Киев идти на уступки Мир, Сегодня, 04:29
Было мало: Мерц сравнил Путина с Гитлером Мир, Сегодня, 02:52
Разведка Британии раскрыла ложь РФ о фронте и потерях Мир, Сегодня, 02:23
Стрельба возле Университета Брауна в США: есть многочисленные жертвы — Bloomberg Мир, Сегодня, 02:12
Будет серьезное возмездие: Трамп пригрозил за убийство военных в Сирии Мир, Сегодня, 01:55
Bloomberg: ЕС готовит правила, которые позволят отсрочить запрет бензиновых авто в Европе Мир, Сегодня, 01:45
Выезд за границу: нужно ли иметь полис медицинского страхования Украина, Сегодня, 01:45
"Был скромным и вежливым": во время военных учений умер священник со Львовщины. Общество, Сегодня, 00:40
Европейский кубок наций: румыны обыграны - Украина в третий раз победила Хоккей, Вчера, 23:38
В матче Меца и ПСЖ на поле встретились Цитаишвили и Забарный Футбол, Вчера, 23:17
Известно, сколько целей поразили ВСУ в России в ноябре Украина, Вчера, 22:36
Удар по судну: Зеленский пообещал России ответ Украина, Вчера, 22:25
Ни света, ни здоровья: Россия наращивает удары по системе здравоохранения Украины Украина, Вчера, 22:22
Зимним чемпионом УПЛ стал клуб из Черкасс Спорт, Вчера, 22:22
Россияне потеряли темп на севере Покровска - ВСУ Украина, Вчера, 22:17
Сырский раскрыл детали обороны под Покровском Украина, Вчера, 22:16
Как сохранить картофель свежим до весны: есть один секрет Общество, Вчера, 22:04

Список рубрик:

Украина
Россия
Мир
Бизнес
Шоу-биз и культура
Спорт
Политика
ЧП
Наука и здоровье
Общество