Fable 5 и Mythos 5 возвращаются с новыми механизмами безопасности

Новейшие передовые LLM от Anthropic — Claude Mythos 5 и Claude Fable 5 — снова доступны, но с дополнительными ограничениями безопасности. 30 июня правительство США ввело экспортный контроль в отношении обеих моделей, вынудивший компанию приостановить их глобальное распространение. Всего через 19 дней это решение было отменено.

На следующий же день лаборатория ИИ объявила о повторном развёртывании нейросетей. Однако теперь данные продукты будут иметь дополнительные ограничения, направленные на решение проблем безопасности, отмеченных чиновниками.

Fable 5 опять на всех платформах по всему миру: Claude Platform, Claude.ai, Claude Code и Claude Cowork. Для пользователей премиум-класса, оформивших подписку на тарифные планы Pro, Max, Team и некоторые планы Enterprise, она будет иметь ограничение до 50% от еженедельных лимитов до 7 июля, после чего станет доступна в виде кредитов на использование.

Компания подтвердила, что ознакомилась с отчётом Amazon, который послужил поводом для директивы об экспортном контроле. В нём говорилось о джейлбрейке — методе, позволяющем Fable 5 выявлять уязвимости софта и, в одном случае, предоставлять эксплойт, обходя встроенные средства защиты модели.

Хотя Anthropic заявила, что описанная методика «не выявила каких-либо уникальных кибервозможностей уровня Mythos», вендор выпускает новую версию Fable 5, оснащённую «улучшенным классификатором безопасности, который нацелен на выявление и блокировку поведения, описанного в отчёте».

Речь идёт о небольшой автоматизированной системе ИИ, определяющей во время взаимодействия с LLM, когда от бота требуется выполнить потенциально опасную задачу или получить подобного рода результаты, и блокирует его ответы на запросы. Сообщается, что новый классификатор нивелирует обнаруженный исследователями Amazon взлом «более чем в 99% случаев».

По информации от Anthropic, исследователи из Центра стандартов и инноваций в области ИИ Министерства торговли США (CAISI) протестировали новые меры защиты и охарактеризовали их как «чрезвычайно надёжные». Компания намерена и дальше их совершенствовать, чтобы лучше отличать подлинные злоупотребления от законных запросов и уменьшить количество ложных срабатываний.

Усам Оздемиров

3 июля, 2026

Fable 5 и Mythos 5 возвращаются с новыми механизмами безопасности

«Лаборатории разрабатывают технологию, но правила должны устанавливать граждане»

«Эта работа не доказывает, что ИИ повсеместно создаёт рабочие места»

Силовики видят использование ИИ отягчающим обстоятельством

ИИ-правкомиссия создаст профильные рабочие группы

Signal: Агентный ИИ плохо совместим со сквозным шифрованием

Члены сообщества Dialog предсказывают «ИИ-зиму»

ChatGPT впервые пересёк «экватор» (отрицательно)

Anthropic отрицает существование «универсального джейлбрейка» для Fable 5

Григоренко: Мы не рассматриваем запрет на иностранные нейросети

Безопасная разработка

Читалка

Опубликовано распоряжение Правительства Российской Федерации от 27.05.2026 №1237-р

Опубликовано распоряжение Правительства Российской Федерации от 27.05.2026 №1237-р

Банк России опубликовал проект указания «О внесении изменений в Положение Банка России от 13 января 2025 года №850-П»

Банк России опубликовал проект указания «О внесении изменений в Положение Банка России от 13 января 2025 года №850-П»

Календарь мероприятий

Наши медиауслуги

Новый номер

Подписаться на новости BIS Journal / Медиа группы Авангард

Стать автором BIS Journal

Fable 5 и Mythos 5 возвращаются с новыми механизмами безопасности

Смотрите также

Безопасная разработка

Читалка

Календарь мероприятий

Наши медиауслуги

Новый номер

Подписаться на новости BIS Journal / Медиа группы Авангард

Стать автором BIS Journal