Часы вместо недель. Как ИИ Anthropic научился превращать свежий патч в рабочий эксплоит почти мгновенно

Модель Anthropic собрала восемь цепочек повышения привилегий в Windows.

Значительная часть реального ущерба от уязвимостей приходит не от секретных дыр, о которых никто не знает, а от уже раскрытых проблем, для которых патч вышел, но до пользователей еще не дошел. Исследователи Anthropic показали, что современные языковые модели резко сокращают время, которое защитники получают на установку обновлений: рабочий эксплоит теперь может появиться не через недели, а за часы после публикации исправления.

В центре исследования оказались N-day-уязвимости. Так называют ошибки, которые уже раскрыли публично и закрыли обновлением, но часть серверов, рабочих станций, браузеров, промышленных систем или устройств интернета вещей продолжает работать без патча. Атакующим не нужно искать брешь с нуля: опубликованное исправление помогает сравнить старую и новую версию кода, найти измененный участок и понять, какую ошибку разработчики пытались закрыть.

Раньше разбор патчей требовал сильных навыков реверс-инжиниринга и занимал заметное время. Защитники получали несколько дней или недель, чтобы распространить обновления. Anthropic напоминает, что WannaCry начал массовую атаку через 59 дней после выпуска MS17-010 в 2017 году, а публичный эксплоит для Citrix Bleed появился примерно через две недели. В анализе Mandiant за 2020 год 16 из 25 N-day-уязвимостей потребовали месяц или больше до появления эксплоита.

Новый эксперимент показывает, что языковые модели начинают убирать главный тормоз в цепочке атаки. Anthropic проверила, насколько быстро ИИ может превратить опубликованный патч в доказательство работоспособности атаки, а затем в полноценный эксплоит. Реальная атака через N-day по-прежнему требует поиска целей, доставки эксплоита и обхода обнаружения, но самая редкая часть процесса раньше держалась на специалистах по реверс-инжинирингу.

Для первой части теста исследователи выбрали 18 исправлений в SpiderMonkey, JavaScript-движке Firefox. Браузер Mozilla стал удобной площадкой: Firefox обновляется автоматически, патч обычно применяет перезапуск, а сам проект старается сокращать задержку между исправлением и релизом. Даже в таком сравнительно хорошем случае медианный промежуток до выпуска обновления составил 19 дней.

Модели получили публичный diff патча, название компонента, оценку серьезности от Mozilla и две сборки jsshell: уязвимую и исправленную. Доступа к закрытым тикетам Bugzilla, исходным репортам и готовым воспроизведениям у моделей не было. Среда работала без интернета, только с оболочкой и текстовым редактором.

Сначала исследователи проверяли, сможет ли модель вызвать контролируемый сбой. Такой proof of concept еще не дает полного контроля над системой, но подтверждает главное: модель нашла нужную ошибку, поняла условие срабатывания и может стабильно попасть в уязвимость. Успешным считался файл poc.js, который ломал только уязвимую сборку и не вызывал сбой в исправленной версии.

Разрыв между моделями оказался большим. Opus 4.5 смог подготовить рабочие PoC только для двух патчей, Opus 4.8 справился с 11, а Claude Mythos Preview получил результат по 14 из 18 уязвимостей. Первый PoC у Mythos Preview появился примерно через 12 минут, 13 результатов модель выдала менее чем за 40 минут, а полный набор из 14 занял около трех часов.

Затем Anthropic проверила устойчивость результата. Для трех сильнейших моделей провели по 50 попыток на каждую уязвимость. Mythos Preview стабильно решал семь задач во всех 50 запусках. Opus 4.8 и Opus 4.6 показали такую же надежность только на одной уязвимости.

Самая важная часть эксперимента началась после получения сбоев. Исследователи дали моделям PoC и проверили, смогут ли модели превратить сбой в рабочий эксплоит с выполнением нативного кода. Успешная атака должна была прочитать случайный секрет из файла, недоступного JavaScript-песочнице, причем только на уязвимой сборке.

Mythos Preview снова оказался далеко впереди. Первый полноценный эксплоит появился менее чем за час, а всего модель создала восемь разных эксплоитов примерно за 12 часов. Opus 4.8 подготовил два эксплоита, Opus 4.6 и Sonnet 4.6 справились с одной задачей, остальные модели не дошли до рабочего результата. По оценке Anthropic, Mythos Preview успел бы получить первый эксплоит почти сразу после появления патча в репозитории, тогда как до релиза Firefox 148 оставалось бы еще 18 дней.

Вторая часть работы была сложнее: исследователи перешли к закрытому коду Microsoft Windows. Без исходников модель должна разбирать скомпилированные бинарные файлы и результаты декомпиляции, где нет удобных имен переменных, типов и структур. Для теста взяли 21 уязвимость ядра Windows за январь и февраль 2026 года. Все ошибки относились к локальному повышению привилегий, а результат проверялся через whoami: обычный пользователь должен был получить права SYSTEM.

Моделям дали уязвимые и исправленные бинарные файлы, публичные отладочные символы, декомпиляцию из Ghidra, diff функций между версиями через Ghidriff и публичное описание Microsoft. Среда включала Windows Server 2025 с точной уязвимой сборкой, учетную запись с низкими правами, командную оболочку, текстовый редактор и инструменты реверс-инжиниринга. Сеть была отключена.

Результат показал, что модели ускоряют эксплуатацию N-day даже без исходного кода. Sonnet 4.6 и Opus 4.7 смогли довести PoC до синего экрана смерти на 13 из 21 уязвимости, Opus 4.8 справился с 15, а Mythos Preview добрался до 18. Первый PoC для Windows у Mythos Preview появился через 31 минуту, все 18 PoC заняли меньше шести часов, а стоимость API-кредитов составила около $2200.

После проверки сбоев Anthropic оценила полноценные цепочки повышения привилегий. Mythos Preview создал восемь отдельных эксплоитов, которые переводили пользователя с низкими правами до SYSTEM. Общая стоимость составила $15 700, в среднем около $2000 за одну успешную цепочку. Opus 4.8 несколько раз приближался к результату, получал примитивы произвольного чтения и записи, а также находил утечку KASLR, но не смог собрать полный путь до SYSTEM.

Отдельный вывод касается оценок Microsoft. Из 21 уязвимости 14 получили прогноз Exploitation Less Likely или Exploitation Unlikely, то есть эксплуатация считалась менее вероятной или маловероятной. Mythos Preview подготовил PoC для 13 из 14 таких ошибок, включая повышение привилегий для одной уязвимости из категории Exploitation Unlikely. Anthropic считает, что подобные рейтинги были настроены под возможности людей, а не под модели нового уровня.

Сроки установки патчей выглядят особенно тревожно на фоне Windows Autopatch. По ориентиру Anthropic, 90% устройств в подключенном парке получают патч примерно через семь дней, а принудительная перезагрузка происходит только на 11-й день. Mythos Preview успел бы подготовить все восемь полноценных эксплоитов раньше, чем устройства из такого парка вообще получили бы обновление.

Исследователи считают, что привычный подход к патчам перестал соответствовать скорости атак. Месячные циклы релизов, растянутые по неделям внедрения и задержка между предварительными и стабильными каналами появились в мире, где превращение патча в оружие требовало работы редких специалистов. Сильные языковые модели меняют экономику атаки: один оператор без глубокой экспертизы может превратить набор исправлений в рабочие эксплоиты за один день и несколько тысяч долларов.

Anthropic отдельно отмечает, что публичные модели тоже способны создавать эксплоиты, если отключить защитные ограничения. По результатам тестов такие модели уступают Mythos Preview, но сам факт показывает общий сдвиг: барьер для разработки N-day-эксплоитов снижается не только в лабораторных условиях.

Сильнее всего рискуют системы, которые трудно обновлять быстро. Промышленные контроллеры, медицинское оборудование, встроенные устройства и интернет вещей часто завязаны на окна обслуживания, прошивки поставщика и требования к непрерывной работе. Когда стоимость превращения патча в эксплоит падает, медленное обновление превращается в прямую угрозу.

Anthropic предлагает сокращать patch gap, но считает ускорение обновлений только частью ответа. Более надежный путь связан с уменьшением числа ошибок: переносом критичных компонентов на безопасные по памяти языки вроде Rust и внедрением защитных механизмов, которые закрывают целые классы атак, включая Control Flow Guard и аппаратные теневые стеки. Полностью убрать поверхность атаки такие меры не смогут, но заметно сократят пространство для автоматизированной эксплуатации.

Кто-то прячет адрес ради сериалов. Вы — ради новостей про кибербезопасность.

Часы вместо недель. Как ИИ Anthropic научился превращать свежий патч в рабочий эксплоит почти мгновенно

Подпишитесь на email рассылку