Псевдонимизация как инструмент безопасности и способ легитимной обработки персональных данных. Часть 4: Методы обезличивания и псевдонимизации персональных данных

В нашей серии статей мы уже рассмотрели псевдонимизацию и обезличивание персональных данных с разных сторон — терминология и существующие документы, инструменты обработки, псевдонимизация и обезличивание как мера безопасности персональных данных. Теперь мы вплотную подошли к теме методов обезличивания и псевдонимизации персональных данных.

 

Россия

В России действует Приказ Роскомнадзора №996, который определяет методики и методологии обезличивания персональных данных. В нём описываются четыре метода: метод введения идентификаторов, метод изменения состава или семантики, метод декомпозиции, метод перемешивания. Кроме того приказ устанавливает определённые требования к обезличенным персональным данным, которые получаются в результате применения этих методов.

Самый очевидный и используемый метод обезличивания персональных данных — введение идентификаторов. Согласно приказу, обезличенные по данному методу персональные данные обладают полнотой, структурированностью, но при этом они могут не обладать релевантностью и могут быть недостаточно анонимными. То есть нельзя сказать, что этот метод на 100% обезличивает персональные данные.

Метод изменения состава или семантики, согласно Роскомнадзору, один из самых надёжных методов обезличивания персональных данных с точки зрения безопасности для субъектов, но здесь возникает проблема полноты персональных данных и их семантической целостности.

«Кроме того в Приказе Роскомнадзора даются рекомендации относительно применения различных методов обезличивания персональных данных, говорится, что операторы самостоятельно определяют, какие методы использовать с учётом задач, целей. Для разных задач могут использоваться разные методы. Например, для статистических исследований могут использоваться все четыре метода, а для актуализации персональных данных, ведения учёта субъектов метод состава или семантики уже использоваться вряд ли может, поскольку это повлияет на точность», — пояснила главный юрист компании Double Data Екатерина Калугина в ходе своего выступления на GDPR Day Online 2020.

 

Европейский союз

В ЕС ещё в 2014 году было выпущено Мнение рабочей группы по техникам псевдонимизации (Opinion 05/2014 on Anonymisation Techniques). В целом все техники, которые предлагаются данным документом, можно поделить на техники рандомизации, обобщения и псевдонимизации. Кроме того там устанавливаются критерии, которые должен учитывать оператор, чтобы оценивать каждый из методов с точки зрения того, насколько псевдонимизированны персональные данные в результате применения данных методик.

Среди этих принципов можно назвать «выделение персональных данных». То есть если после применения того или иного метода псевдонимизации мы можем выделить из этих данных те данные, которые идентифицируют субъекта, то нельзя говорить о полной анонимизации, только о псевдонимизации.

Второе — это «сохранение возможной связи». То есть если сохраняется связь как минимум между двумя атрибутами, принадлежащими субъекту, то по-прежнему нельзя говорить о полной анонимизации, можно говорить только о псевдонимизации персональных данных.

Третье — «риск логического выведения» какой-то информации из обезличенных персональных данных. То есть если мы на основании каких-то двух атрибутов, например, даты рождения и адреса, можем определить конкретное лицо, несмотря на то, что остальные данные у нас, например, заменены на айдишники, то до сих пор это не полная анонимизация, а псевдонимизация.

«И при выборе способа мы должны учитывать опять же масштаб обрабатываемых персональных данных, их категории, основание для обработки, отношения между оператором и субъектом и контекст обработки персональных данных, кроме того доступный уровень технологий», — добавила Екатерина Калугина.

Среди методов, которые перечислены в разъяснении рабочей группы, можно выделить такие как дополнительный шум, дифференциальная приватность, агрегация данных, хэширование и шифрование с помощью специальных ключей. Например, при использовании метода добавления шума наши данные становятся неточными. А при использовании метода агрегации, или обобщения, мы можем указывать, например, не конкретный возраст, а какую-то возрастную группу.

«Во всех методах обезличивания или псевдонимизации персональных данных мы ищем баланс между максимальной анонимностью полученных обезличенных персональных данных и полезностью тех данных, которые мы получаем», — отметила Екатерина Калугина.

Продолжение следует...

7 июня, 2020

Подписаться на новости BIS Journal / Медиа группы Авангард

Подписаться
Введите ваш E-mail

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных

28.11.2025
«Сбер»: Модель GigaChat 2 MAX сопоставима с ChatGPT 4
28.11.2025
МФО не смогут верифицировать клиентов с помощью банковских ID
28.11.2025
«Утильсбор» для харда принесёт в бюджет 218 млрд рублей за два года
28.11.2025
РКН хочет заблокировать WhatsApp. Теперь официально
27.11.2025
«Наступит время, когда к идее внедрения карт системы "Мир" вернутся»
27.11.2025
ВТБ готовится полностью обновить свой онлайн-банк
27.11.2025
«Фрод-рулетка» вышла из пилотного режима
27.11.2025
Компании переходят к экосистемам, где данные и ИИ формируют единое технологическое ядро
27.11.2025
Т2: «Белые списки» необходимо финализировать
27.11.2025
В кластере «Ломоносов» прошла крупнейшая мультиформатная конференция TECH WEEK 2025

Стать автором BIS Journal

Поля, обозначенные звездочкой, обязательные для заполнения!

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных