Котики и паучки

Котики и паучки
Современные поисковые системы стараются понимать естественный язык вопрошающего. В идеале поисковик должен найти адекватный результат даже в том случае, если ни одно слово из поискового запроса не встречается в найденной странице, но их смысл соответствует.

Именно такая задача стоит перед DLP-системой: найти то, не знаю чтодокумент с конфиденциальной информацией, изложенной любыми словамиили даже без слов. Семантические, лингвистические и всякие онтологические методы анализа тут расцветают.

Неудивительно, что в составе DLP-систем современного поколения появляется краулер, он же паук-сборщик, он же поисковый робот – в точности как у "больших" поисковиков. Он ходит по всем закоулкам корпоративной сети с пропуском-"вездеходом", понимает все языки, протоколы и форматы и ищет, где чего плохо лежит. Но, разумеется, не тащит всё найденное в собственную базу, как это делают жадный Гугл и любопытный Яндекс, иначе он сам мог бы стать источником утечек.

Страх тянет назад, любопытство вперед. И только здравый смысл нервно топчется на месте и ругается вполголоса.
Смотреть ещё!

Краулер появился в последней версии нашего продукта – InfoWatch Traffic Monitor Enterprise 4.0. Чем ответят конкуренты?

Alt text
Обращаем внимание, что все материалы в этом блоге представляют личное мнение их авторов. Редакция SecurityLab.ru не несет ответственности за точность, полноту и достоверность опубликованных данных. Вся информация предоставлена «как есть» и может не соответствовать официальной позиции компании.

CyberCamp 2025 открыл регистрацию.

С 20 по 25 октября пройдет IV онлайн-конференция по кибербезопасности CyberCamp 2025 — крупнейшие киберучения в России, где прокачивают реальные навыки.

Регистрируйся прямо сейчас.

Реклама. 18+ АО «Инфосистемы Джет», ИНН 7729058675


InfoWatch

Блог компании infowatch infowatch.livejournal.com