Защита информации. Исследователи научились скрывать от ИИ истинную суть сказанного

Команда специалистов IBM, Amazon и Техасского университета разработала атаку на алгоритмы обработки естественного языка (Natural Language Processing, NLP), с помощью которой им удалось изменить поведение модели искусственного интеллекта.

Атака,названная исследователями «атакой перефразирования», была представлена на конференции по вопросам ИИ в Стэнфордском университете в понедельник, 1 апреля. Ее суть заключается в изменении вводимого текста таким образом, чтобы при сохранении первоначального смысла ИИ воспринимал его по-другому.

К примеру, существует алгоритм ИИ, анализирующий содержимое электронных писем и обозначающий их как «спам» или «не спам». Злоумышленник может так модифицировать текст спам-сообщения, чтобы ИИ классифицировал его как «не спам». В то же время для человека смысл сообщения останется без изменений.

Предыдущие варианты атак на текстовые модели предполагали изменение одного слова в предложениях. Такое модифицирование текста действительно позволяло «обмануть» алгоритм, однако сами предложения при этом звучали неестественно и резали ухо. Команда исследователей IBM, Amazon и Техасского университета решила не менять слова в предложениях, а перефразировать их полностью, сохраняя при этом читабельность.

Исследователи создали алгоритм для поиска оптимальных изменений в предложениях, которые позволили бы манипулировать поведением модели NLP. На конференции в Стэнфордском университете команда представила наглядные примеры таких изменений. К примеру, заменив предложение «Цены ниже, чем у некоторых известных конгломератов» на «Цены ниже, чем у некоторых известных брендов, указанных ниже», исследователям удалось заставить модель NLP классифицировать откровенно рекламное сообщение как «не спам».

3 апреля, 2019

Безопасникам

Исследователи научились скрывать от ИИ истинную суть сказанного

Новые требования ФСТЭК по сертификации еще больше сужают рынок средств защиты

97% финансовых мобильных приложений не обеспечены защитой от атак

Банк России и Российская государственная детская библиотека подготовили межрегиональный диктант по финансовой киберграмотности для школьников 11—15 лет

«Группа Тинькофф» создала суперкомпьютер «Колмогоров»

Создание крупномасштабной инфраструктуры совместно используемой флэш-памяти

«Росатом» выбрал разработчиков «дорожных карт» по цифровым технологиям

Депутаты Госдумы предложили шифровать информацию, передаваемую в Рунете, с помощью отечественных средств криптографии

Visa и Mastercard обяжут российские банки выпускать только бесконтактные карты

Взломщик «звездных» учетных записей Apple признал свою вину

Безопасная разработка

Читалка

Принят стандарт ГОСТ Р 72118-2025 «Защита информации. Системы с конструктивной информационной безопасностью. Методология разработки»

Принят стандарт ГОСТ Р 72118-2025 «Защита информации. Системы с конструктивной информационной безопасностью. Методология разработки»

Опубликован проект постановления Правительства РФ «Об утверждении Перечней типовых отраслевых объектов критической информационной инфраструктуры»

Опубликован проект постановления Правительства РФ «Об утверждении Перечней типовых отраслевых объектов критической информационной инфраструктуры»

Календарь мероприятий

Наши медиауслуги

Новый номер

Подписаться на новости BIS Journal / Медиа группы Авангард

Стать автором BIS Journal