"Слова" с отрицательным весом

"Слова" с отрицательным весом
Одним из наиболее эффективным (на мой взгляд) методом анализа исходящего трафика средствами DLP является, так называемый, лингвистический анализ. В ряде систем он реализован следующим образом: слову или словосочетанию ставится в соответствие некоторое число - "вес". Когда суммарный вес сообщения переваливает через определенный порог - происходит срабатывание.
name='more'>

Например, если бы меня попросили отлавливать утечки цикла "Ведьмак" книг Анжея Сапковского, то определенно в таблицу "слов-весов" у меня бы попали "Меригольд", "Дийкстра" и "Каэр Морхэм", "Редания", "Скоя'то'эли" и другие имена, города, страны, организации и прочие творения мысли автора, которые крайне редко встретишь не на просторах страниц его книг...

Но что если будет отправляться не сама книга, а рецензия на нее? В защите которой (по странному стечению обстоятельств) - нет необходимости. А наша организация почему-то постоянно берет и отправляет эти "рецензии", причем это нормальный бизнес-процесс... и растет число ложных срабатываний, все больше прибавляется работы. Нехорошо :)

И тут нам помогут "слова" с отрицательным весом. Слова, которые не используются в оригинальном тексте книги, но которые частенько встречаются в пересказах. Я бы добавил в таблицу с отрицательными весами "слова": "сага", "фэнтези", "фэнтезийный мир", "мир Сапковского", "польский" и т.д. и т.п.

Из всех DLP, которые тестировали, пока такую (на мой взгляд, тривиальную с точки зрения разработки), функцию обеспечивает только ZGate . Функция, признаюсь, не особо часто нужна - но таки может быть полезна...

Есть правда некоторые опасения, что как только "враг" прознает про нее - начнет использовать для обхода... Но давайте на чистоту - есть способы обхода и попроще.
Alt text

Не ждите, пока хакеры вас взломают - подпишитесь на наш канал и станьте неприступной крепостью!

Подписаться