За последнее время в интернет просочились данные миллионов пользователей FacebookLinkedIn и Clubhouse. Фактически, если вы суммируете все три, это составит информацию более чем на 1 миллиарда пользователей в совокупности. Но вы, возможно, слышали, что все три компании говорили, что взлома не было. Так в чем же дело?

Если вас беспокоит ваша личная информация, вам может быть интересно, что происходит, поскольку эти две вещи кажутся противоречащими друг другу. С одной стороны, реальность такова, что информация о миллиардах пользователей этих сервисов внезапно становится доступной. С другой стороны, все три службы заявляют, что за этим «не было взлома». Могут ли оба эти утверждения быть правдой? Если да, то как?

Оба они верны. Они верны, потому что за всеми этими тремя событиями стоит нечто, называемое «скрейпинг». Все три службы в конечном итоге обвиняют «скрейпинг» в сборе данных, а он отличается от взлома или атаки.

Разница между «скрейпингом» и «взломом» может не иметь для вас значения: если ваши данные находятся вне каких-либо или всех этих событий, и вы не хотите, чтобы они там были, конечный результат будет таким же. И, к сожалению, ваша работа — защитить вашу информацию от взлома. Никто другой не сделает этого за вас.

Поэтому важно понимать, что такое скрейпинг и как он работает. Таким образом, вы сможете лучше защитить свою личную информацию от подобных ситуаций в будущем.

 

Что такое скрейпинг?

«Скрейпинг» — это когда программа или скрипт берет информацию с веб-страницы или службы и копирует ее, то есть берет ее прям с экрана.

Например, если у вас есть общедоступный веб-сайт с именами и номерами телефонов людей из разных отделов на отдельных веб-страницах, кто-то может создать программу или скрипт, чтобы «скрейпить» этот веб-сайт и собрать все эти имена и номера телефонов из всех этих отдельных страниц и поместите в один список.

В некоторых случаях скрейпинг может быть действительно полезным, поскольку он собирает разрозненные данные в одном месте. Использовать единый список имен и телефонных номеров проще, чем просматривать несколько веб-страниц.

Что наиболее важно, при скрейпинге собираются данные, которые уже доступны. В нашем примере это общедоступный веб-сайт, поэтому единственное, что произошло, это то, что информация, которая уже стала общедоступной, собрана вместе, и ее легче получить и использовать. Если при скрейпинге собрана информация, которая еще не была доступна, это будет взлом или атака. Но сам по себе скрейпинг не собирает данные, которые были скрыты или защищены.

Все три компании указали, что информация, которая «утекла», уже была общедоступной и является результатом анализа. Другими словами, люди написали скрипты или программы, которые копируют и собирают информацию, которая уже была общедоступной в их сервисах, для создания этих огромных списков данных.

 

Что вы можете сделать со скрейпингом

Скорее всего, когда вы зарегистрировались на любом из этих сервисов и опубликовали свою информацию публично, вас устраивало, что эта информация видна на страницах Facebook, LinkedIn или Clubhouse. Возможно, вы не ожидали, что информация может оказаться общедоступной в таких списках больших данных. Одно дело знать, что кто-то может найти ваш номер телефона, перейдя на страницу Facebook. Это другое дело, что информация теперь хранится в больших файлах с возможностью поиска в интернете.

Именно здесь различие между «взломом» и «скрейпингом» должно иметь для вас наибольшее значение.

Эти компании правы: их не взламывали; информация уже была общедоступной. Но если вас не устраивает, что ваша информация попадает в этот формат, вам придется взять дело в свои руки.

Во-первых, важно понимать, что любая общедоступная информация всегда подвергается риску считывания. Будь то веб-страница или платформа социальных сетей, лучше всего помнить, что в отношении данных общедоступные данные всегда являются общедоступными. Когда данные являются общедоступными, вы не можете контролировать, кто их копирует и что они с ними делают. Если они общедоступные, они могут вечно находиться в интернете вне вашего контроля.

Во-вторых, единственный способ гарантировать, что ваши общедоступные данные не будут извлечены или использованы не так, как вы ожидаете, — это просто не публиковать их. Если вас не устраивает, что информация может попасть в подобные списки, либо защитите ее, используя элементы управления конфиденциальностью (если они есть), либо, что еще лучше, не размещайте ее там вообще.

И если у вас есть данные, которые вам не нужны, что вы можете с этим поделать? К сожалению, ничего. Вот почему так важно быть уверенным, что информация, которую вы публикуете, — это информация, над которой вы можете потерять контроль.

В конце концов, эти утечки данных являются напоминанием о том, что общедоступная информация является общедоступной, и если вы хотите защитить свою информацию, единственный способ быть уверенным — не публиковать ее. Это важно понимать, потому что велики шансы, что в будущем подобных скрейпингов будет больше. И, как мы видели в этих случаях, единственный, кто может и будет защищать ваши данные от скрейпинга, — это вы. И как только данные соберут, их уже не вернуть.

 

Оригинал материала

7 мая, 2021

Подписаться на новости BIS Journal / Медиа группы Авангард

Подписаться
Введите ваш E-mail

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных

18.03.2025
II конгресс «Флагманы цифровизации — 2025»: в фокусе — эффективность
18.03.2025
РКН: Риски нарушения прав субъектов ПДн минимизированы
18.03.2025
Октябрь в финсекторе начнётся под флагом антифрода
17.03.2025
Блага iMessage распространяются на «андроидов»
17.03.2025
Авторское право больше не будет помехой для ИИ?
17.03.2025
Европа под угрозой «кибернаводнения»? Имён пока никто не называет
17.03.2025
ЦБ РФ: Идентификацию по биометрии стоит вводить с временным лагом
17.03.2025
Глобально финсектор не готов к массовому запуску цифрового рубля
14.03.2025
Защищая щит. Servicepipe модернизировал ядро DosGate для интеграции с NGFW
14.03.2025
На «трамповских» скоростях. Чего хотят в российском ИТ-секторе

Стать автором BIS Journal

Поля, обозначенные звездочкой, обязательные для заполнения!

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных