Группа немецких ученых из Заарландского университета разработала технологию, позволяющую распознавать тексты, которые печатают матричные принтеры, анализируя издаваемые ими звуки.
В своем исследовании ученые использовали 24-игольчатый принтер Epson LQ-300 II, но уверяют, что на его месте мог быть любой другой матричный принтер. Правда, под каждую конкретную линейку устройств придётся настраивать программное обеспечение по распознаванию.
Принтеру давались команды печатать ряд английских текстов — как общего характера (из "Википедии"), так и специфического (медицинского). Дело в том, что в Германии, как говорит приведенная исследователями статистика, матричными принтерами пользуется около 60% врачей.
Стук иголок по бумаге записывался при помощи микрофона фирмы Sennheiser, затем пропускался через программы распознавания и коррекции. Распознавание происходит на уровне целых слов, которым софт должен быть заранее обучен (ориентация на отдельные символы оказалась слишком сложной, поскольку "соседние" звуки накладываются друг на друга).
Это позволяет проводить два типа экспериментов: один касается случаев, когда тематика печатаемого текста известна заранее (например, хакер "прослушивает" рецепты, которые печатает доктор), а второй — соответственно, когда неизвестна. В первом случае работа проводится по специфическому словарю (вероятность того, что в тексте используются, к примеру, медицинские термины или словосочетания, характерные для медицинских текстов, выше), во втором — по общему.
Согласно представленным результатам, в случае когда тематика документа известна заранее, точность распознавания текста "на слух" может достигать 95%. Во втором случае точность может доходить до 70%.
Кроме того, ученые утверждают, что данную технологию можно распространить и на струйные принтеры. Они тоже издают определенные звуки — за счет пузырьков чернил и, в некоторых случаях, пьезоэлектрических элементов. Их тоже можно было бы распознавать. Однако, проблема заключается в том, что эти звуки слишком тихие и их заглушает шум, который производят механические части печатающего устройства. Поэтому уловить их с помощью микрофона не удалось.
А лазерные принтеры, как говорят исследователи, вовсе неуязвимы к такого рода атакам.
Наш канал — питательная среда для вашего интеллекта