За последнее время в интернет просочились данные миллионов пользователей FacebookLinkedIn и Clubhouse. Фактически, если вы суммируете все три, это составит информацию более чем на 1 миллиарда пользователей в совокупности. Но вы, возможно, слышали, что все три компании говорили, что взлома не было. Так в чем же дело?

Если вас беспокоит ваша личная информация, вам может быть интересно, что происходит, поскольку эти две вещи кажутся противоречащими друг другу. С одной стороны, реальность такова, что информация о миллиардах пользователей этих сервисов внезапно становится доступной. С другой стороны, все три службы заявляют, что за этим «не было взлома». Могут ли оба эти утверждения быть правдой? Если да, то как?

Оба они верны. Они верны, потому что за всеми этими тремя событиями стоит нечто, называемое «скрейпинг». Все три службы в конечном итоге обвиняют «скрейпинг» в сборе данных, а он отличается от взлома или атаки.

Разница между «скрейпингом» и «взломом» может не иметь для вас значения: если ваши данные находятся вне каких-либо или всех этих событий, и вы не хотите, чтобы они там были, конечный результат будет таким же. И, к сожалению, ваша работа — защитить вашу информацию от взлома. Никто другой не сделает этого за вас.

Поэтому важно понимать, что такое скрейпинг и как он работает. Таким образом, вы сможете лучше защитить свою личную информацию от подобных ситуаций в будущем.

 

Что такое скрейпинг?

«Скрейпинг» — это когда программа или скрипт берет информацию с веб-страницы или службы и копирует ее, то есть берет ее прям с экрана.

Например, если у вас есть общедоступный веб-сайт с именами и номерами телефонов людей из разных отделов на отдельных веб-страницах, кто-то может создать программу или скрипт, чтобы «скрейпить» этот веб-сайт и собрать все эти имена и номера телефонов из всех этих отдельных страниц и поместите в один список.

В некоторых случаях скрейпинг может быть действительно полезным, поскольку он собирает разрозненные данные в одном месте. Использовать единый список имен и телефонных номеров проще, чем просматривать несколько веб-страниц.

Что наиболее важно, при скрейпинге собираются данные, которые уже доступны. В нашем примере это общедоступный веб-сайт, поэтому единственное, что произошло, это то, что информация, которая уже стала общедоступной, собрана вместе, и ее легче получить и использовать. Если при скрейпинге собрана информация, которая еще не была доступна, это будет взлом или атака. Но сам по себе скрейпинг не собирает данные, которые были скрыты или защищены.

Все три компании указали, что информация, которая «утекла», уже была общедоступной и является результатом анализа. Другими словами, люди написали скрипты или программы, которые копируют и собирают информацию, которая уже была общедоступной в их сервисах, для создания этих огромных списков данных.

 

Что вы можете сделать со скрейпингом

Скорее всего, когда вы зарегистрировались на любом из этих сервисов и опубликовали свою информацию публично, вас устраивало, что эта информация видна на страницах Facebook, LinkedIn или Clubhouse. Возможно, вы не ожидали, что информация может оказаться общедоступной в таких списках больших данных. Одно дело знать, что кто-то может найти ваш номер телефона, перейдя на страницу Facebook. Это другое дело, что информация теперь хранится в больших файлах с возможностью поиска в интернете.

Именно здесь различие между «взломом» и «скрейпингом» должно иметь для вас наибольшее значение.

Эти компании правы: их не взламывали; информация уже была общедоступной. Но если вас не устраивает, что ваша информация попадает в этот формат, вам придется взять дело в свои руки.

Во-первых, важно понимать, что любая общедоступная информация всегда подвергается риску считывания. Будь то веб-страница или платформа социальных сетей, лучше всего помнить, что в отношении данных общедоступные данные всегда являются общедоступными. Когда данные являются общедоступными, вы не можете контролировать, кто их копирует и что они с ними делают. Если они общедоступные, они могут вечно находиться в интернете вне вашего контроля.

Во-вторых, единственный способ гарантировать, что ваши общедоступные данные не будут извлечены или использованы не так, как вы ожидаете, — это просто не публиковать их. Если вас не устраивает, что информация может попасть в подобные списки, либо защитите ее, используя элементы управления конфиденциальностью (если они есть), либо, что еще лучше, не размещайте ее там вообще.

И если у вас есть данные, которые вам не нужны, что вы можете с этим поделать? К сожалению, ничего. Вот почему так важно быть уверенным, что информация, которую вы публикуете, — это информация, над которой вы можете потерять контроль.

В конце концов, эти утечки данных являются напоминанием о том, что общедоступная информация является общедоступной, и если вы хотите защитить свою информацию, единственный способ быть уверенным — не публиковать ее. Это важно понимать, потому что велики шансы, что в будущем подобных скрейпингов будет больше. И, как мы видели в этих случаях, единственный, кто может и будет защищать ваши данные от скрейпинга, — это вы. И как только данные соберут, их уже не вернуть.

 

Оригинал материала

7 мая, 2021