Новая модель искусственного интеллекта Fable от компании Anthropic, предназначенная для безопасной работы в сфере кибербезопасности, вызвала недовольство среди исследователей отрасли. Специалисты утверждают, что установленные компанией ограничения срабатывают слишком часто и блокируют даже безобидные запросы, передает TechCrunch.
"(Fable) отклоняет любые запросы, которые хоть как-то связаны с кибербезопасностью. Даже такие безобидные задачи, как чтение сообщения в блоге", — написала в соцсети X исследовательница в области безопасности, работающая в IBM X-Force, Валентина "Чомпи" Пальмиотти.
Если система считает запрос потенциально рискованным, чат автоматически приостанавливается. В таком случае пользователь получает уведомление о том, что механизмы безопасности обнаружили темы, связанные с кибербезопасностью или биологией.
[see_also ids="684288"]
Ограничения ввели для снижения риска использования модели в разработке вредоносного программного обеспечения или компрометации систем. Некоторые биологические темы блокируются из-за опасений относительно возможного использования ИИ для создания биологического оружия. В то же время один из специалистов в сфере кибербезопасности написал в соцсети X, что ограничения Fable срабатывают даже при запросе на обычный обзор программного кода.
Ветеран отрасли кибербезопасности Мэтт Суиче подтвердил, что просьба написать безопасный код также может быть ошибочно классифицирована как деятельность в сфере кибербезопасности, из-за чего пользователя автоматически переводят на модель Claude Opus 4.8. По словам Суиче, система, вероятно, в значительной степени ориентируется на ключевые слова, из-за чего ограничения могут срабатывать на любые термины, связанные с лексикой кибербезопасности.
"Но это понятно, поскольку мы все еще находимся на начальном этапе, и они все еще адаптируют свои защитные механизмы. Я уверен, что со временем они будут развиваться, поскольку Anthropic и другие передовые компании-разработчики моделей будут более тесно сотрудничать с нынешним новым поколением компаний по кибербезопасности", — добавил эксперт, который сейчас работает в стартапе по кибербезопасности ИИ Tolmo.
Специализированная модель кибербезопасности Mythos, на базе которой создан Fable, Anthropic представила в апреле в рамках программы Project Glasswing. Сначала для защиты критически важного программного обеспечения и инфраструктуры доступ к ней получило ограниченное количество компаний и организаций. Как пишет TechCrunch, на прошлой неделе компания расширила программу на сотни организаций в 15 странах.