«Сверхстрашный охотник за багами» оказался пустышкой. Что не так с моделью Mythos от Anthropic

«Сверхстрашный охотник за багами» оказался пустышкой. Что не так с моделью Mythos от Anthropic

Почему Mythos — не фабрика нулевых дней, а просто помощник.

image

Anthropic сама подогрела интерес к новой модели Mythos рассказами о машине для поиска уязвимостей, которая якобы настолько сильна, что выпускать ее в широкий доступ опасно. Но спустя несколько недель вокруг проекта нарастает уже другой сюжет: часть посторонних пользователей, по данным Bloomberg, смогла получить доступ к превью-версии, а первые оценки показывают, что Mythos вряд ли тянет на оружие, способное перевернуть киберпреступность.

Anthropic открыла доступ к Mythos в режиме превью для ограниченного круга организаций в рамках Project Glasswing. Задумка выглядела просто: компании получают модель заранее, находят и закрывают дыры в собственной инфраструктуре до того, как похожие инструменты попадут в руки злоумышленников. Однако в среду представитель Anthropic подтвердил, что доступ к Claude Mythos Preview могли получить и пользователи, не входившие в число партнеров Glasswing. Речь, по словам компании, идет не о производственном API Anthropic, а об окружении одного из сторонних подрядчиков, с которым разработчик работает над созданием моделей. Признаков того, что инцидент затронул внутренние системы Anthropic, компания пока не видит.

По данным Bloomberg, доступ получили несколько человек, которые якобы догадались о сетевом адресе модели, опираясь на структуру прежних запусков Anthropic. Издание также связало историю с недавней утечкой у Mercor, стартапа по подбору специалистов для крупных ИИ-лабораторий, включая Anthropic. Ранее Mercor сообщал, что пострадал от цепочной атаки через LiteLLM. Участники закрытого Discord-канала, которым приписывают несанкционированный доступ, по информации Bloomberg, не пытались применять Mythos во вредоносных целях и лишь экспериментировали с моделью.

История показала сразу две проблемы. Первая касается самой схемы ограниченного запуска: удержать чувствительный инструмент в узком круге сложно, особенно когда вокруг проекта работают подрядчики, исследователи безопасности и инженеры, умеющие быстро находить слабые места в цепочке поставок и инфраструктуре. Вторая проблема связана с ожиданиями. Anthropic слишком громко продвигала Mythos как почти недоступный и крайне опасный инструмент, а подобная подача только подогрела интерес. Для части исследователей запуск начал выглядеть не как закрытый тест, а как приглашение проверить систему на прочность.

При этом первые отзывы о реальных возможностях модели звучат заметно спокойнее рекламных обещаний. AWS и Mozilla сообщили, что Mythos быстро и полезно помогает искать уязвимости, сокращает объем ручной работы и экономит время команд безопасности, но не превосходит сильных специалистов-людей. Технический директор Mozilla Бобби Холли рассказал, что Mythos нашла 271 уязвимость в Firefox 150, однако среди результатов не оказалось категории ошибок, которую не смог бы обнаружить исследователь высокого уровня без помощи модели. По сути, речь идет об автоматизированном помощнике для поиска багов, а не о фабрике нулевых дней, которую нужно прятать от всего мира.

Сомнения вызывает и масштаб заявлений Anthropic. Компания говорила о тысячах дополнительных уязвимостей высокой и критической степени опасности, но сторонние исследователи считают, что подтвержденных находок намного меньше. Исследователь VulnCheck Патрик Гаррити на прошлой неделе оценивал число таких случаев примерно в 40, а некоторые аналитики допускают, что надежно подтвержденных примеров может быть еще меньше. Другой инженер, изучивший отчеты по CVE, демонстрационные эксплойты, 44-подсказочный транскрипт, 244-страничную system card, партнерские соглашения Glasswing и материалы red team, пришел к выводу, что реальные баги у Mythos есть, но вокруг проекта слишком много шума и натяжек. В качестве примеров критики указывают на демонстрации с отключенной песочницей Firefox, на серьезную ручную помощь человеку в отдельных сценариях и на случаи, где уязвимость находила вовсе не Mythos, а публичная модель Opus 4.6.

В итоге история с Mythos пока больше похожа не на побег сверхопасного инструмента, а на столкновение громкого маркетинга с более прозаичной реальностью. Модель, судя по ранним отзывам, полезна и ускоряет работу специалистов по безопасности, но не дает злоумышленникам качественно нового преимущества, которого у них раньше не было. Часть экспертов прямо говорит, что атакующим и без Mythos хватает открытых и коммерческих моделей для ускорения поиска уязвимостей.