В начале был хаос

В начале был хаос
80% данных, накапливаемых в компаниях – неструктурированные.

Рост объёмов таких данных (200% в год, между прочим) не оставляет никакой надежды, что данные когда-нибудь приобретут структуру и упорядоченность. Разве что, их распознаванием и раскладыванием по полочкам займутся роботы со знанием естественного языка; но это ещё не скоро.

Следовательно, потенциальный доход софтопроизводителей лежит в работе с мусоромданными неопределённой структуры. Собственно, на этом поднялись поисковики. Одни поднялись, другие провалились, будучи не в силах сладить с человеческой неформальностью. За рынком глобального и национального поиска идёт рынок поиска корпоративного, потом личного.

Как раз на корпоративном поиске мы сейчас и зарабатываем денежки. Правда, DLP ищет не как Гугл – один образец во многих документах, а наоборот – много образцов в одном документе.

Кроме поиска работа с неструктурированными данными включает их обобщение и подсчёт всякой статистики. А здесь поле деятельности едва начали пахать.

футурология интернет-разведка статистика соцсети DLP-система
Alt text
Обращаем внимание, что все материалы в этом блоге представляют личное мнение их авторов. Редакция SecurityLab.ru не несет ответственности за точность, полноту и достоверность опубликованных данных. Вся информация предоставлена «как есть» и может не соответствовать официальной позиции компании.

III конференция по защите данных «Гарда: Сохранить всё. Безопасность информации». Москва, 16.10.2025.

Вас ждет день, насыщенный дискуссиями о будущем кибербеза и цифровой экономики. 2000+ участников, 30+ экспертов, 3 параллельных трека, при поддержке ФСТЭК и Минцифры. В этом году в фокусе внимания — защита персональных данных и искусственный интеллект.

Регистрация уже доступна.

Реклама. 16+ ООО «Гарда Технологии», ИНН 5260443081


InfoWatch

Блог компании infowatch infowatch.livejournal.com