3 Сентября, 2013

Прячем листья в лесу

InfoWatch
Всё прослушивается, всё просматривается, всё контролируется... Любой байт информации, прошедший через Гугл, Фейсбук, Айфон или международные платёжные системы, становится достоянием АНБ. Катастрофа? Нет, новые возможности для защиты!
       

Оно всё прослушивается и просматривается программами. Роботами. Примитивными алгоритмами, которым до высокого звания Искусственного интеллекта ещё пилить и пилить. Те объёмы данных, которыми оперируют скайпы и е-беи, настолько огромны, что человек не в состоянии просматривать даже одну стамиллионную долю. Там всё – строго автоматически.

Таким образом, возникает возможность сохранить конфиденциальность своих документов, в публичных сетях, облачных ресурсах и зарубежных каналах связи. Надо только не позволить вражеским алгоритмам анализа их найти и вычленить из океана Big Data.

Исключить и заменить ключевые слова. Вставить нейтрализующие  слова. Назвать вещи не своими именами. Не ставить гриф или уведомление. И ещё десятка два способов, о которых хорошо ведомо SEOшникам. Их работа – поднять ресурс в поисковом рейтинге. Но легко справятся и с противоположной задачей – опустить. Все эти призмы с эшелонами устроены аналогично гуглам и яндексам. Как не  существует отдельной  военной и гражданской криптографии, так и алгоритмы поиска и категоризации – одинаковы для всех.

Поэтому DLP-система может на периметре ИС вместо принудительного шифрования принудительно редактировать документ, делая его непригодным для автоматического поиска и категоризации. В этой задаче кроме SEOшных и спамерские технологии пригодятся.

или введите имя

CAPTCHA
мишка на сервере
9 Сентября, 2013
правильно ли я понимаю, что с помощью какого-нибудь байесовского алгоритма будут искаться письма, похожие на образец, а затем с помощью заранее составленных словарей будет производиться замена ключевых слов на синонимы? Не «спалят ли контору» системы антиплагиата, которые по идее и заточены на отлов таких хитроПЯТАЯТОЧКАых.
0 |
бородатый бородач
11 Сентября, 2013
при таком подходе ты будешь находиться ниже уровня естественного шума, т.е. выборка по синонимам не сможет указать на тебя, а лишь завалит вопрошаемого тоннами малоинтересного трэша. И раскопать что-то персональное станет слишком затратным. Дополнтельно можно отметить, что имеет смысл еще и языковой перевод, с учетом распространенности языка в этих ваших интернетах.
0 |