Учёные нашли способ сделать нейросети бесполезными для хакеров и мошенников.

Австралийская федеральная полиция (AFP) и Университет Монаша объединили усилия, чтобы использовать ИИ против самих преступников. В совместной лаборатории AiLECS (AI for Law Enforcement and Community Safety) создаётся инструмент под названием Silverer — прототип технологии, которая способна «отравлять» данные и тем самым срывать попытки злоумышленников генерировать нелегальный контент с помощью нейросетей.
Метод основан на идее «data poisoning» — намеренном внесении едва заметных изменений в цифровые изображения, чтобы искусственные модели, обучающиеся на этих данных, создавали искажённые, некачественные или полностью бесполезные копии. Такие микроскопические вмешательства делают фото визуально неизменным для человека, но вводят в заблуждение алгоритмы машинного обучения. В результате попытки использовать их для создания дипфейков, экстремистских материалов или фальшивых сцен насилия приводят лишь к размытым, беспорядочным наборам пикселей.
По словам специалистов, название Silverer отсылает к серебру, применяемому при изготовлении зеркал: идея в том, чтобы вернуть злоумышленнику отражение вместо содержимого. Перед публикацией фотографий пользователи смогут пропустить их через Silverer, чтобы добавить в структуру изображения защитный слой, обманывающий нейросети.
В AiLECS отметили, что генерация вредоносных визуальных данных становится всё более серьёзной проблемой: открытые инструменты для создания дипфейков и искусственного контента доступны практически каждому, и порог входа в такие технологии минимален. Федеральная полиция Австралии фиксирует рост объёма фейковых CSAM-материалов, созданных ИИ, — именно против подобных практик и направлены новые методы.
В AFP пояснили, что хотя технологии отравления данных находятся на раннем этапе развития, первые испытания уже демонстрируют перспективные результаты. Если преступник попытается сгенерировать изображение на основе защищённого набора, итог будет искажён или не иметь ничего общего с оригиналом. Таким образом создаётся защитный барьер, который не уничтожает источник, но делает его бесполезным для злонамеренного использования.
Внедрение подобных решений не остановит полностью злоупотребления искусственным интеллектом, однако сможет значительно усложнить жизнь тем, кто пытается использовать его для преступных целей. В полиции сравнили технологию с «лежачими полицейскими» — не абсолютным запретом, а системой препятствий, которые снижают скорость и затрудняют движение нарушителей.
AiLECS и AFP также рассматривают возможность применения Silverer в служебной работе полиции, чтобы уменьшить поток ложных изображений, с которыми приходится сталкиваться при расследованиях. Кроме того, Silverer должен стать одним из первых инструментов, которые смогут использовать не только специалисты по кибербезопасности, но и обычные граждане, желающие предотвратить злоупотребления своими фотографиями и видео в интернете.