Эволюционный агент нашел схему, о которой люди не договорились годами.

Исследователи из Калифорнийского университета в Беркли заявили, что модели ИИ уже становятся инструментом для поиска и оптимизации алгоритмов. В препринте с говорящим названием Barbarians at the Gate. How AI is Upending Systems Research группа из 17 авторов описывает, как открытая система OpenEvolve, созданная по мотивам AlphaEvolve от Google DeepMind, помогла заметно ускорить алгоритм балансировки нагрузки в системах экспертного параллелизма для больших языковых моделей.
Команда взяла за основу открытый EPLB из проекта DeepSeek. Та реализация работала медленно, поскольку была написана на Python и использовала цикл с линейным поиском подходящего GPU. В среднем перераспределение экспертов занимало около 540 мс. Исследователи также ориентировались на закрытую версию из нераскрытой лаборатории уровня фронтира, где на перебалансировку уходило 19,6 мс. OpenEvolve предложил иной подход к упаковке экспертов по GPU. Модель заменила циклы векторизованными тензорными операциями и ввела зигзагообразное разбиение. Время выполнения сократилось до 3,7 мс. Это пятикратный выигрыш по сравнению с референсом и примерно в 146 раз быстрее реализации DeepSeek. По словам авторов, результат получен за пять часов работы и менее чем за десять долларов, при этом запросы исполнялись смесью из 80 процентов Gemini 2.5 Flash и 20 процентов Gemini 2.5 Flash Lite.
В статье приводится еще одно кейс-исследование. С помощью OpenEvolve ускорена аналитика на отношениях, где SQL-запросы вызывают инференс LLM для каждой строки. Прирост производительности около трех раз. Авторы называют такой подход ADRS, то есть AI-Driven Research for Systems. Суть проста. Модель генерирует гипотезы, проверяет их, затем итеративно улучшает решения. В работе делается вывод, что по мере взросления таких инструментов роль человека будет смещаться к постановке задач и стратегическому управлению.
Контекст в индустрии выглядит обнадеживающим. Весной Google рассказал об успехах AlphaEvolve. Агент на основе эволюционного программирования улучшил оркестрацию в дата-центрах, оптимизировал матричное умножение для TPU и ускорил ядро FlashAttention в трансформерах. В журнале Nature вышла статья авторов из Google DeepMind о самообучающемся поиске правил обучения с подкреплением. Исследователи пытаются показать, что машинный поиск эвристик способен конкурировать с ручными подходами.
Соавтор работы Одри Чэн, аспирантка UC Berkeley, подчеркнула, что вопрос о творчестве ИИ остается открытым, однако на практике новизна в системной и базовой инженерной науке понимается через улучшение метрик. Если алгоритм заметно быстрее или эффективнее, значит он нов. Чэн отмечает, что модели опираются на огромный корпус знаний и иногда находят неожиданные переносы идей между областями. По ее словам, в задачах производительности ИИ уже обгоняет человеческие решения. Такие задачи проще проверять, а примеры внедрения в компаниях уже есть, в том числе у поставщиков наблюдаемости. Главный тормоз сейчас верификация и надежная методика оценки. Когда появятся зрелые рамки для проверки безопасности и отказоустойчивости, подходы ADRS смогут выходить за пределы узкой оптимизации и шире применяться в системном программировании и не только в компьютерных науках.
Работа берклиевской группы показывает важную тенденцию. Поиск удачных алгоритмических решений перестает быть исключительно ручным ремеслом. Человеку остается сформулировать задачу и границы, а дальше итерации и тонкую настройку берет на себя ИИ. Если результаты, подобные ускорению EPLB, будут воспроизводиться в других классах задач, то оптимизация систем станет заметно дешевле и быстрее, а конкуренция переместится в область качества постановки проблемы и качества проверки решений.