Давно обещал показать вам некоторые подробности того, как мы ловим утечки. Точнее, как выглядят оповещение и настройка. name="cutid1">
"Обнаружены категории" означает, что сработал один из сторожков, который распознал в передаваемых данных конфиденциальную или иную интересующую нас информацию – категорию.
Категория настраивается так:
Категорияне сводится к наличию хотя бы одного ключевого слова. Для отнесения к ней документу (сообщению, файлу) требуется набрать рейтинг выше установленного порога. Обычно это несколько ключевых слов.
Чтоб вы не подумали, что мы работаем только по ключевым словам (это – примитив, на который способны все конкуренты и даже безнадёжно отставшие), вот ещё один скриншотик с настройкой параметров "категории".
Слова распознаются во всех формах, на всех поддерживаемых кодировках, а также при печати в графическом виде (если установлен OCR-модуль).
Шаблоны – это что-то вроде regexp-ов. Например, для распознавания персональных данных, когда невозможно использовать ключевые слова. Ищем мы, скажем, паспортные данные, чьи именно – заранее не известно. Но известен примерный формат и состав этих данных. Шаблон их обнаружит. name='cutid1-end'>