8 апреля, 2014, BIS Journal №1(12)/2014

Конфиденциальным данным нужен комплекс технологий защиты!


Пшехотская Екатерина

кандидат филологических наук, руководитель отдела лингвистики (Компания InfoWatch )

Рябов Сергей

старший разработчик отдела лингвистики (Компания InfoWatch )

Что могут противопоставить проблеме утечек информации современные технологии DLP?

По данным Аналитического Центра InfoWatch, финансово-кредитные учреждения занимают третье место в мире по числу утечек, обнародованных в СМИ за указанный период, среди всех организаций. Только за первую половину 2013 года было официально зафиксировано 330 000 утекших записей. При этом считается, что обнародованное число инцидентов составляет не более 1–3% от их реального числа.

Анализ различных инцидентов утечки данных в российских финансово-кредитных организациях показывает, что ущерб от единичного случая утраты существенного объема критичной информации может составлять десятки и даже сотни миллионов рублей, т.к. при подсчете ущерба от утечки клиентских баз следует учитывать не только прямые, но и косвенные потери. Например, в розничных банках они могут выражаться в количестве ушедших клиентов, которое может доходить до 30% от общего числа клиентов банка после одного такого инцидента. В корпоративном сегменте этот показатель зависит от уровня текучести менеджеров по работе с клиентами.

Как же утекает информация, и что могут противопоставить этой проблеме современные технологии DLP (Data Leakage Prevention – защита от утечек данных)? Чтобы ответить на этот вопрос, рассмотрим, в какой форме возможна отправка конфиденциальных данных за пределы компании.

КЛИЕНТСКИЕ БАЗЫ ДАННЫХ

Проблема утечки клиентских баз данных является особенно болезненной для финансовых институтов, поскольку клиентские базы являются одним из основных бизнес-активов предприятий данной отрасли. Утечка клиентских данных напрямую или косвенно всегда приводит к финансовым потерям. В то же время стоит отметить, что вероятность случайной потери такой информации чрезвычайно мала. В подавляющем большинстве случаев персональные данные клиентов «выносятся» из компании злонамеренно ее же сотрудниками. Эту проблему позволяет решить разработанная InfoWatch технология детектирования выгрузок баз данных.

Эта технология осуществляет «умную защиту» клиентских баз, присваивая статус конфиденциальности не всей базе целиком, а взаимосвязи определенных столбцов (например, имя + номер телефона или имя + номер счета), информация в которых в совокупности является конфиденциальной. При попытке сотрудника переслать куда-либо эту информацию, система зафиксирует нарушение политики безопасности и уведомит офицера безопасности об инциденте.

НЕФОРМАЛИЗОВАННЫЙ ТЕКСТ

Конфиденциальная информация может утекать из компании в виде неформализованного текста – всевозможной переписки сотрудников в корпоративной почте, Skype, системах обмена сообщениями и т.д. Проанализировать электронную переписку людей нелегко, поскольку в процессе онлайн-общения часто используются неформальные выражения, могут возникать ошибки и опечатки, может использоваться транслитерация. Если DLP-система не учитывает эти нюансы, обойти ее несложно. Анализ письменной речи – своеобразная лакмусовая бумажка качества DLP-систем.

На сегодняшний день решения Info-Watch единственные на рынке предлагают анализ текста с учетом морфологии. Это значит, что если для банка, например, ключевым словом, определяющим секретность передаваемой информации, является слово «ликвидность», то все формы этого слова («ликвидности», «ликвидностью», «ликвидностями» и т.д.) будут отслеживаться решением InfoWatch, и конфиденциальная информация не сможет покинуть защищаемый периметр организации.

Очевидно, что типы ценной конфиденциальной информации варьируются в зависимости от отрасли. Каждая компания защищает свои информационные активы, которые могут быть весьма специфическими: нефтегазовая компания – данные о месторождениях, банки – данные платежных карт, клиентские базы и так далее. Например, чтобы информация, ценная именно для банка, отслеживалась и анализировалась, в InfoWatch Traffic Monitor Enterprise встроена специальная отраслевая база терминологии (так называемая база контентной фильтрации, сокращенно БКФ).

Данная база позволяет детектировать такие категории информации, как инсайдерская информация, тендеры, инкассация, информация по валютным и неторговым операциям, межбанковским кредитам, а также многие другие категории, представляющие интерес для финансовых институтов. При использовании отраслевой БКФ эффективность детектирования конфиденциальной информации, характерной именно для данной отрасли, возрастает в разы. Кроме того, процедура распределения информации по различным категориям конфиденциальности на этапе внедрения DLP решения проходит в полуавтоматическом режиме, что позволяет экономить временные и людские ресурсы клиента.

КОНФИДЕНЦИАЛЬНЫЕ ДОКУМЕНТЫ

Сотрудник может попытаться переслать конфиденциальный документ, хранящийся в неизменяемом виде (договор, устав или регламент, презентация и пр.). В этом случае защищать информацию от разглашения будет технология цифровых отпечатков. На этапе настройки системы собирается база документов, для которых необходимо создать цифровые отпечатки содержимого. При этом, в отличие от большинства других DLP-продуктов, InfoWatch Traffic Monitor Enterprise позволяет отслеживать не только текстовые документы, но и бинарные данные – картинки, чертежи, диаграммы, медиафайлы и пр, а также их комбинации, которые часто встречаются в pdf- и ppt-документах.

Для распознавания текста из изображений в решениях InfoWatch используется технология Оптического распознавания символов (англ. Optical character recognition, сокращенно OCR), то есть электронного перевода изображений в текстовые данные. Данная технология позволяет подойти к анализу изображений, которые сотрудник решит переслать в почте или мессенджере, с ещё одной стороны – извлекать из изображений текст и анализировать его на предмет наличия конфиденциальных данных. Этот подход позволяет защитить от утечек, например, чертежи и схемы, отсканированные и переданные за пределы сети предприятия, по ошибке или намеренно, скриншот, сделанный с экрана монитора и т.д.

В целях отслеживания движения договоров разработчики InfoWatch также создали технологию детектирования печатей, которая позволяет контролировать уже заверенные версии документов. Эта технология была разработана по многочисленным запросам клиентов InfoWatch: защита финальных версий договоров в особенности важна, поскольку именно подписанные и заверенные печатью документы содержат строго конфиденциальную информацию о специальных условиях и договоренностях, достигнутых сторонами.

В финансовых и коммерческих организациях как сотрудники, так и клиенты часто заполняют анкеты и специальные формы документов. Для детектирования таких документов была разработана технология детектирования заполненных форм. Очевидно, что отслеживать передачу пустых формуляров и анкет, в которых нет никаких конфиденциальных сведений, не имеет смысла. Они становятся конфиденциальными только в заполненном виде, так как могут содержать, например, персональные данные или иную чувствительную информацию. Например, заполненные клиентские заявки на выдачу кредита, персональные данные сотрудника, заполненные при приеме на работу и т.д.

ФОРМАЛИЗОВАННЫЕ ДАННЫЕ

Во многих конфиденциальных документах есть информация, представленная в соответствии с определенными шаблонами: серия и номер внутреннего паспорта гражданина РФ – это 4 и 6 цифр, номер банковской карты – 16 цифр и т.д. DLP-система InfoWatch детектирует данный вид информации, представленный не только в текстовой форме, но и в виде сканов документов, кредитных карт и паспортов.

Преимущество технологий InfoWatch в том, что они не просто отслеживают данные, соответствующие определенной «маске», но и осуществляют распознавание. Например, система проверяет соответствие перехваченного 16-значного номера алгоритму формирования номеров банковских карт. Это позволяет свести к минимуму количество ложноположительных срабатываний, зафиксировав и выявив все инциденты.

Как можно видеть, за достаточно короткий срок DLP-системы очень серьезно эволюционировали и сегодня лидирующие решения предлагают обширный набор технологий, позволяющих отслеживать и анализировать информацию с самых различных точек зрения. Встает вопрос: возможно ли определить набор технологий, необходимых и достаточных для DLP? Однозначного ответа нет. С одной стороны, возможности DLP-системы, описанные выше, покрывают все основные нужды заказчиков, с другой – всегда найдется бизнес-кейс, для которого необходима доработка какой-либо технологии.

Так, однажды специалисты по внедрению InfoWatch столкнулись с ситуацией, когда сотрудники компании-заказчика бесконтрольно вставляли факсимиле подписи своего руководителя в различные документы. Руководитель потребовал доработать DLP-решение таким образом, чтобы оно отслеживало факсимильные подписи по аналогии с детектором печатей. Появился бизнес-кейс – появилась технология детектирования факсимиле подписей. Не решаемых проблем нет.

 

Таким образом, совокупное применение перечисленных технологий в DLP решении InfoWatch позволяет защитить критически важные для бизнеса данные и информационные активы, потеря которых может нанести организации непоправимый финансовый и репутационный урон. При этом стоимость внедрения и обслуживания DLP-системы соизмерима с размером только прямых потерь от одного случая утечки небольшого объема конфиденциальных данных. Следовательно, использование таких систем имеет ощутимый экономический эффект и помогает банкам и другим коммерческим организациям защитить ценные данные и серьезно сэкономить на ликвидации последствий от инцидентов.

 

BIS-СПРАВКА
Е.А. Пшехотская – автор ряда патентов по автоматической обработке естественного языка

 

 

Смотрите также

Подпишись на новости!
Подписаться