Изучив реакцию 25 ИИ-моделей на «поэтические атаки», исследователи из университета La Sapienza и школы Sant’Anna выяснили, что вредоносные промты оформленные в виде стихов чат-боты пропускают значительно чаще.

Учёные создавали потенциально опасные промпты с рифмами, метафорами и художественными оборотами. Оказалось, такая подача помогает обойти защиту ИИ в 62% случаев для стихов, написанных людьми, и в 43% — для сгенерированных. Самыми уязвимыми стали модели DeepSeek и Google — например, Gemini 2.5 Pro в тестах выдала «вредный» результат в 20 попытках из 20. Решения OpenAI и Anthropic были уязвимы лишь в каждом десятом эпизоде.

Как итог, «поэтические атаки» успешно обходят фильтры предотвращения киберинцидентов, манипуляций, нарушений приватности и попыток написать малварь.

Комментируя это исследование, руководитель группы анализа вредоносного ПО центра Solar 4RAYS Станислав Пыжов отметил, что для многих LLM стихотворная форма — нетипичный паттерн: получая подобные вводные, чат-бот переключается на «творческий режим», где художественное содержание считается приоритетом, а этика и безопасность отходят на второй план.

3 февраля, 2026

Подписаться на новости BIS Journal / Медиа группы Авангард

Подписаться
Введите ваш E-mail

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных

17.06.2026
CISA предписывает устанавливать патчи, исходя из степени риска
17.06.2026
Darktrace: В защите профессионального спорта «важен каждый момент»
17.06.2026
РСХБ: Биометрические технологии становятся основой для предоставления услуг
17.06.2026
«Никакое количество государственного регулирования не исправит это»
17.06.2026
Anthropic отрицает существование «универсального джейлбрейка» для Fable 5
17.06.2026
Платформа «Гостех» станет «технологической» осенью 2027 года
16.06.2026
Абоненты «Билайна» получили доступ к Spotify и Netflix через «белый VPN»
16.06.2026
Россияне заблокировали почти 2 млн «симок» через «Госуслуги»
16.06.2026
ЦСР — о сдвиг спроса от базовой защиты к более сложным сценариям обнаружения
16.06.2026
Индия банит Telegram «в интересах суверенитета и целостности»

Стать автором BIS Journal

Поля, обозначенные звездочкой, обязательные для заполнения!

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных