Выскажу не только мою личную точку зрения, но и консолидированное мнение всей дирекции развития цифровых технологий Института развития информационного общества, которую возглавляет д.ф.-м.н., проф. Александр Богданов: в фундаментальной информатике вопрос больших данных хорошо проработан, и большинство данных, которые сегодня считаются большими, таковыми не являются.
Естественно, для областей, близких к большим данным, вопрос анонимизации является ключевым, у него есть несколько решений. Но областей, где эти проблемы встают во весь рост, на самом деле не так много. И надо понимать, что если данные не являются большими (в смысле определения фундаментальной информатики), то решения для них существуют, и они хорошо разработаны.
Например, большие данные часто упоминаются, когда речь заходит о цифровом промышленном предприятии, где работают системы IoT. Но IoT в настоящее время — это технология, далёкая от больших данных (слишком слабые процессоры и малые транзакции), поэтому для неё применяются стандартные решения как для централизованных систем. При этом, конечно, имеет смысл не скупиться и поставить приличную защиту на гейт во внешний мир.
Сегодня много говорят о проблемах безопасности данных, в частности, в системах видеоаналитики, используемых в рамках проектов безопасных городов или региональных МИС в здравоохранении. На самом деле описать характер киберугроз в подобных случаях – относительно простая задача: необходимо чётко разделять типы больших данных и связанные с ними угрозы. Для централизованных систем этот вопрос решён, и надо просто применять правильные подходы. Для систем типа частных облаков существуют подходы к решению проблемы, и надо заниматься разработкой соответствующих платформ применительно к рассматриваемым задачам. Для публичных облаков общего решения даже в теории пока нет, и надо разрабатывать системы безопасности для каждого конкретного случая.
При этом надо отделять чисто технические решения от организационных сценариев работы. Например, традиционным аспектом безопасности данных, и больших данных в том числе, является незаконное проникновение в информационные базы компаний и организаций с целью получения личных данных. На наш взгляд, при правильном подходе современные системы защиты позволяют полностью перекрыть периферию и блокировать попытки проникновения. Однако инсайдер может свести на нет все возможности такой системы. Думаю, что это задача скорее для психологов – чисто техническими средствами её не решить.
Стоит отметить, что самые продвинутые системы защиты персональных данных от утечек фактически работают по принципу «виртуализации» данных, когда все организации работают не с реальными данными клиентов, а с некоторыми их виртуальными образами. Для применения такого подхода есть только два существенных вопроса – цена и скорость обработки данных. С точки зрения самих технологий обработки – это применение статистических методов, которые себя очень хорошо зарекомендовали в политической психологии.
Однако всёсущественно сложнее, если мы говорим о реальных больших данных, там пока работают только статистические методы. Они гарантируют анонимизацию, но пригодны не для всех приложений. Правда, в основных запросах, связанных с рекламой, эти методы самые эффективные.
Сегодня самые жаркие дискуссии в обществе по поводу сбора и обработки больших данных граждан идут в основном не вокруг академических подходов и определений, а вокруг эмоционально наполненных понятий типа «цифровой суверенитет человека». Полагаю, что это вопрос консенсуса между обществом и властью. Он требует обсуждения и определяется тремя факторами: адекватностью власти, информированностью населения и внешними угрозами. Причём последними ни в коем случае нельзя манипулировать. У нас пока ни власть, ни общество к такому консенсусу не готовы.
Если в целом говорить о главных направлениях развития регулирования больших данных в современном обществе, то сначала надо констатировать: по большому счёту, регулирования больших данных пока вообще нет. Для наведения порядка в этой сфере необходимо провести аудит и понять, кому, для каких целей и в каком виде такие данные нужны. И если отделить потребности от рекламы, то окажется, что ситуация гораздо проще, чем думалось, и она вполне регулируема.
Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных
Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных