5 Июня, 2013

Котики и паучки

InfoWatch
Современные поисковые системы стараются понимать естественный язык вопрошающего. В идеале поисковик должен найти адекватный результат даже в том случае, если ни одно слово из поискового запроса не встречается в найденной странице, но их смысл соответствует.

Именно такая задача стоит перед DLP-системой: найти то, не знаю чтодокумент с конфиденциальной информацией, изложенной любыми словамиили даже без слов. Семантические, лингвистические и всякие онтологические методы анализа тут расцветают.

Неудивительно, что в составе DLP-систем современного поколения появляется краулер, он же паук-сборщик, он же поисковый робот – в точности как у "больших" поисковиков. Он ходит по всем закоулкам корпоративной сети с пропуском-"вездеходом", понимает все языки, протоколы и форматы и ищет, где чего плохо лежит. Но, разумеется, не тащит всё найденное в собственную базу, как это делают жадный Гугл и любопытный Яндекс, иначе он сам мог бы стать источником утечек.

Страх тянет назад, любопытство вперед. И только здравый смысл нервно топчется на месте и ругается вполголоса.
Смотреть ещё!

Краулер появился в последней версии нашего продукта – InfoWatch Traffic Monitor Enterprise 4.0. Чем ответят конкуренты?