30 Августа, 2011

Лексиль - 2 или что такое Wordle?

Алексей Лукацкий
Как-то года полтора назад я писал про Lexile - инструмент оценки простоты/сложности текста и возможность его использования для документов по ИБ. И вот наткнулся в Интернете на немного другой (автор вообще считает его немного забавным), но все же похожий сервис - Wordle . Суть сервиса проста - он подсчитывет подсунутые ему тексты и выдает на выходе графическую карту частоты слов, удалив предварительно слова, не несущие смысловой нагрузки. Получается достаточно интересно. Вот как, например, выглядит мой блог за последнюю неделю: За счет визуализации сразу становится видно, о чем я писал - ПДн, ФСБ, локализация. А вот как выглядит ФЗ-152: Термин "персональные данные" превалирует над всеми остальными словами. На втором месте - "субъект", "обработка", "право", "РФ". Ну и т.д. Не могу сказать, что практическая ценность у этого инструмента высока, но все равно - достаточно интересно. А в ряде случаев может помочь выявить явные перекосы в использовании того или иного слова. ЗЫ. С русским языком сервис работает неплохо. Только вот морфологию не учитывает.