Подведомственный Роскомнадзору Главный радиочастотный центр разослал письма некоторым хостинг-провайдерам — в них говорится, что сервисы должны оценить, не собирает ли GPTBot (поисковый робот от компании OpenAI) сведения об уязвимости платформ и «иную чувствительную информацию, в том числе содержащую персональные данные». Об этом написал «Коммерсант».
Если адресат выявит «риски», он будет обязан ограничить работу бота. Санкции в случае невыполнения этого требования, однако, не прописаны.
GPTBot был анонсирован в августе — тогда OpenAI заявила, что робот будет собирать информацию из публичного доступа (данные планируется использовать в обучении моделей GPT-4 и GPT-5). При этом владельцы сайтов имеют возможность ограничить доступ бота к страницам.
Глава хостинг-провайдера RUVDS Никита Цаплин уже сообщил, что считает инициативу регулятора «здравой», так как поисковых роботов могут использовать хакеры — для создания на их базе инструментов для взломов и фишинга.
Безопасники из Qrator Labs же отметили: запрет на GPTBot и ему подобные вынудит компании в сфере ИИ и машинного обучения искать альтернативные способы сбора данных. Среди возможных: «маскировка ботов под легитимных пользователей и покупка агрегированных данных у владельцев бот-ферм».