Развитие систем информационной безопасности. AISI предложил разработчикам LLM новый фреймворк

Британский институт безопасности ИИ (AISI) совместно с представителями ИБ-сектора разработал фреймворк с открытым исходным кодом, призванный помочь разработчикам больших языковых моделей повысить уровень защиты.

Backbone Breaker Benchmark (b3) — это новый инструмент оценки, созданный AISI, Check Point и дочерней компанией Check Point Lakera. Он предназначен для того, чтобы помочь разработчикам и поставщикам нейросетей повысить устойчивость «магистральных» LLM, которые обеспечивают работу ИИ-агентов.

В Lakera пояснили: «Вместо того чтобы оценивать все рабочие процессы агентов от начала до конца, b3 фокусируется на отдельных этапах, где магистральная LLM фактически выходит из строя — конкретных моментах, когда ввод данных из командной строки, файла или веб-страницы запускает вредоносный вывод. Именно эти уязвимые места используют злоумышленники — не сама архитектура агента, а уязвимые вызовы модели в ней».

Чтобы помочь разработчикам и поставщикам работать на опережение, b3 применяет новую технику, называемую «снимками угроз». Эти микротесты основаны на краудсорсинговых данных о состязательных атаках, собранных в рамках инициативы Lakera Gandalf: Agent Breaker. Компании могут использовать их, чтобы оценить уязвимость своего ИИ к таким атакам, как эксфильтрация системных запросов, вставка фишинговых ссылок, внедрение вредоносного кода, отказ в обслуживании и несанкционированные вызовы инструментов.

По словам авторов решения, бенчмарк «делает безопасность LLM измеримой, воспроизводимой и сопоставимой для разных моделей и категорий приложений». Матео Рохас-Карулла, соучредитель и главный научный сотрудник Lakera, утверждает, что современные агентные ИИ настолько же безопасны, насколько безопасны языковые модели, на которых они работают.

Старший менеджер по исследованиям и разработкам в Black Duck Эндрю Болстер с осторожностью приветствовал b3: «Такого рода исследования — отличная отправная точка для интеграторов агентов, позволяющая им понять модель угроз, связанных с этими системами. Но для обеспечения безопасности в реальном времени CISO необходимо использовать как эти новые методы оперативной манипуляции/бенчмаркинга, так и проверенные на практике методы тестирования».

Усам Оздемиров

6 ноября, 2025

Технологии

AISI предложил разработчикам LLM новый фреймворк

Шадаев: Новая каспийская ВОЛС ускорит цифровизацию всех стран региона

BSI предупреждает о надвигающемся кризисе управления ИИ

Google и Nvidia ищут энергию для своих ЦОДов в космосе

OpenAI пытается нивелировать правовые риски

OpenAI отреагировала на психическое состояние пользователей ChatGPT

DeepSeek-OCR сэкономит токены при распознавании документов

Нейросети заменят собой трейдеров и младших банкиров?

Исследование: вирусные твиты «тупят» ИИ

Минэнерго предложило решение, которое устроит и ТЭК, и сектор ИИ

Безопасная разработка

Читалка

ФСТЭК России опубликовал документ от 25.11.2025 «Методика анализа защищённости информационных систем»

ФСТЭК России опубликовал документ от 25.11.2025 «Методика анализа защищённости информационных систем»

ФСТЭК России опубликовал «Рекомендации по базовой настройке механизмов безопасности почтовых сервисов от атак, связанных с подменой отправителя (спуфинг-атак)»

ФСТЭК России опубликовал «Рекомендации по базовой настройке механизмов безопасности почтовых сервисов от атак, связанных с подменой отправителя (спуфинг-атак)»

Календарь мероприятий

Наши медиауслуги

Новый номер

Подписаться на новости BIS Journal / Медиа группы Авангард

Стать автором BIS Journal