Британский институт безопасности ИИ (AISI) совместно с представителями ИБ-сектора разработал фреймворк с открытым исходным кодом, призванный помочь разработчикам больших языковых моделей повысить уровень защиты.

Backbone Breaker Benchmark (b3) — это новый инструмент оценки, созданный AISI, Check Point и дочерней компанией Check Point Lakera. Он предназначен для того, чтобы помочь разработчикам и поставщикам нейросетей повысить устойчивость «магистральных» LLM, которые обеспечивают работу ИИ-агентов.

В Lakera пояснили: «Вместо того чтобы оценивать все рабочие процессы агентов от начала до конца, b3 фокусируется на отдельных этапах, где магистральная LLM фактически выходит из строя — конкретных моментах, когда ввод данных из командной строки, файла или веб-страницы запускает вредоносный вывод. Именно эти уязвимые места используют злоумышленники — не сама архитектура агента, а уязвимые вызовы модели в ней».

Чтобы помочь разработчикам и поставщикам работать на опережение, b3 применяет новую технику, называемую «снимками угроз». Эти микротесты основаны на краудсорсинговых данных о состязательных атаках, собранных в рамках инициативы Lakera Gandalf: Agent Breaker. Компании могут использовать их, чтобы оценить уязвимость своего ИИ к таким атакам, как эксфильтрация системных запросов, вставка фишинговых ссылок, внедрение вредоносного кода, отказ в обслуживании и несанкционированные вызовы инструментов.

По словам авторов решения, бенчмарк «делает безопасность LLM измеримой, воспроизводимой и сопоставимой для разных моделей и категорий приложений». Матео Рохас-Карулла, соучредитель и главный научный сотрудник Lakera, утверждает, что современные агентные ИИ настолько же безопасны, насколько безопасны языковые модели, на которых они работают.

Старший менеджер по исследованиям и разработкам в Black Duck Эндрю Болстер с осторожностью приветствовал b3: «Такого рода исследования — отличная отправная точка для интеграторов агентов, позволяющая им понять модель угроз, связанных с этими системами. Но для обеспечения безопасности в реальном времени CISO необходимо использовать как эти новые методы оперативной манипуляции/бенчмаркинга, так и проверенные на практике методы тестирования».

 

Усам Оздемиров

6 ноября, 2025

Подписаться на новости BIS Journal / Медиа группы Авангард

Подписаться
Введите ваш E-mail

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных

03.03.2026
Обналичивание — возможность для скамеров разорвать цифровой след
03.03.2026
К 2030 году 80% промсектора должно импортозаместить ПО
03.03.2026
«Это выглядело как проявление приспособленчества и небрежности»
03.03.2026
F6: 40% пиратских сайтов содержит вредоносный код
03.03.2026
HeadHunter выплатит полмиллиона рублей в рамках программы багбаунти
02.03.2026
Ландшафт угроз со стороны программ-вымогателей становится сложнее
02.03.2026
ЦБ РФ: В 2025 году «нелегалы» надеялись на «крипту» и нейросети
02.03.2026
Реализация криптоторгов потребует усиленных ИБ-механизмов
02.03.2026
Claude — первый независимый?
02.03.2026
«Оборонные возможности — это не товар, который можно продать на аукционе»

Стать автором BIS Journal

Поля, обозначенные звездочкой, обязательные для заполнения!

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных