Нейросети на зарплате у цензуры. РКН потратит 2 миллиарда, чтобы ИИ научился блокировать VPN автоматически

Нейросети на зарплате у цензуры. РКН потратит 2 миллиарда, чтобы ИИ научился блокировать VPN автоматически

Роскомнадзор внедряет машинное обучение для анализа вашего трафика.

image

Роскомнадзор в 2026 году планирует создать и внедрить механизм фильтрации интернет-трафика с использованием машинного обучения. На проект собираются направить 2,27 млрд рублей. Инициатива описана в плане цифровизации ведомства, который 26 декабря внесли на рассмотрение президиума правительственной комиссии по цифровому развитию. С документом ознакомился Forbes.

Машинное обучение - это подход, где математическая модель строит алгоритмы и извлекает закономерности из больших массивов данных. Сейчас фильтрацию российского трафика обеспечивают ТСПУ - технические средства противодействия угрозам. Эти комплексы размещают на сетях операторов связи в рамках закона о «суверенном интернете», а установкой и обслуживанием занимается сам регулятор. Для блокировок используется DPI - технология, которая анализирует содержимое сетевых пакетов и позволяет ограничивать доступ к запрещенным ресурсам.

Через ТСПУ уже заблокировано более миллиона ресурсов, запрещенных в России. Ежедневно ограничения в среднем вводятся для 5500 новых сетевых адресов и доменов, рассказывал в интервью «Известиям» замглавы РКН Олег Терляков в июне 2025 года. Параллельно действует и реестр запрещенных сайтов, который Роскомнадзор ведет с 2012 года: туда попадают площадки с детской порнографией, сведениями о наркотиках и способах суицида, онлайн-казино, экстремистскими материалами и другим контентом, запрещенным к распространению законом о защите детей. Операторы обязаны блокировать такие ресурсы из реестра.

С 2025 года федеральные ведомства должны отчитываться о проектах по внедрению ИИ-технологий, поэтому включение подобных инициатив в программы цифровой трансформации «не удивляет», отмечает источник, близкий к аппарату вице-премьера Дмитрия Григоренко. По его словам, Роскомнадзор может хотеть находить запрещенный контент с помощью машинного обучения, а еще лучше - выявлять VPN-сервисы. Насколько это выполнимо на практике и эффективно с финансовой точки зрения, с учетом необходимости доработки ТСПУ, не очевидно, добавил собеседник Forbes.

«Мы не можем ничего нового сказать по теме», - заявили Forbes в Роскомнадзоре.

Классические DPI-решения позволяют классифицировать типы трафика на основе фиксированных алгоритмов, поясняют в пресс-службе «Мегафона». DPI закрывают большинство базовых задач операторов связи, связанных с управлением сетью и обеспечением стабильности ее работы. При этом развитие сервисов и рост доли шифрованного и усложненного трафика в отдельных случаях требует дополнительных методов. В таких сценариях применяются элементы эвристического анализа трафика, где и помогают механизмы машинного обучения, отметили в компании. «Мегафон» точечно использует такие инструменты, в том числе в защите от мошенников, как часть комплексного подхода к поддержанию устойчивости сети.

По мнению экспертов, интерес регулятора к машинному обучению связан с тем, что владельцы заблокированных ресурсов часто создают «зеркала» с новыми адресами и используют разные приемы обхода ограничений. В таких случаях блокировки по спискам доменов и IP быстро устаревают: вместо одного адреса появляется другой, а сам контент переносится и маскируется. Машинное обучение может позволить искать и ограничивать доступ не только по интернет-адресам, но и по признакам содержания - словам, выражениям, фрагментам предложений и другим маркерам. Одновременно это может помочь находить тех, кто размещает копии или цитирует запрещенные материалы.

Если смотреть на то, как машинное обучение используют корпоративные системы анализа трафика для выявления угроз безопасности, и переносить эти сценарии на масштаб Рунета, то возможны несколько направлений расширения функциональности ТСПУ. Среди них называют выявление зашифрованного трафика и методов обхода блокировок - это важно в контексте курса на блокировку VPN-сервисов. Также упоминаются обнаружение DDoS-атак и выявление взаимодействия с командными серверами ботнетов и другой вредоносной инфраструктурой, которую используют кибермошенники. Еще один вариант - классификация веб-приложений, чтобы находить запрещенные в России сервисы, например отдельные мессенджеры. Дополнительно можно отличать стриминговый трафик от скачивания контента, что позволит выявлять пиратские ресурсы.

Технологии машинного обучения дают возможность более «прицельного» воздействия на сети - например, делать «деградацию» конкретного типа трафика вместо «ковровых» мер. В DPI это способ лучше определять, что именно за трафик проходит по сети, когда классические методы по сигнатурам, портам и другим признакам уже не помогают.

Инструменты машинного обучения на ТСПУ могут использоваться для разработки и автоматического применения правил фильтрации трафика, например для поиска и блокировки VPN-трафика, допускают в отрасли. Также такие технологии могут расширить поиск по содержимому: по текстам на разных языках, по изображениям и видео. В качестве примера приводится Китай, который уже вовсю использует ИИ в мониторинге интернета.

Роскомнадзор уже применяет ИИ для поиска запрещенной информации в интернете. В интервью «Известиям» глава ведомства Андрей Липов в сентябре говорил, что служба использует нейросетевые технологии для анализа текстовой, аудио- и визуальной информации. По его словам, это позволило сократить среднее время обнаружения запрещенной информации до шести часов, тогда как в 2020 году на это уходило около 48 часов.

В июле 2025 года заместитель руководителя Роскомнадзора Вадим Субботин рассказывал, что автоматизированная система службы в среднем за сутки скачивает около 0,5 млн релевантных материалов, и после анализа системой и проверки оператором остается около 2000 материалов с нарушениями российского законодательства. Он объяснял, что автоматизированное «сито» позволяет операторам сосредоточиться на более сложных задачах, повышает эффективность работы и снижает затраты на обработку информации.

Ведомство также уже используют автоматизированные системы «Окулус» и «Вепрь». Первая помогает искать запрещенный контент в видео и аудиозаписях, а вторая - находить так называемые «точки информационной напряженности» в соцсетях и СМИ.

При этом не во всех системах применение ИИ оказалось одинаково эффективным. В системе мониторинга использования персональных данных нейросети тестировали, но, по признанию замруководителя Роскомнадзора Милоша Вагнера, результативность в тестовом режиме оценили в 60%. Чтобы повысить точность анализа, потребовались бы обучающие датасеты по объемам, превосходящим мониторинг всех сайтов, который ведомство проводило за несколько лет, и такие трудозатраты на этом этапе сочли преждевременными в условиях экономии средств.