Физики выдохнули, ЦЕРН ликует. Нейросеть ускорила Большой адронный коллайдер в пять раз и навсегда отменила ручной код

Физики выдохнули, ЦЕРН ликует. Нейросеть ускорила Большой адронный коллайдер в пять раз и навсегда отменила ручной код

Самый сложный прибор человечества починили методом ленивого студента.

image

Коллаборация CMS на Большом адронном коллайдере описала подход, который раньше для экспериментов такого масштаба считался слишком рискованным: полностью восстанавливать картину столкновения частиц с помощью одной обученной модели, а не длинной цепочки правил и проверок, написанных вручную. Авторы утверждают, что новый метод в испытаниях работает не хуже привычной схемы, а местами даёт заметный прирост точности, при этом ускоряет обработку событий за счёт эффективной работы на графических процессорах.

Сами столкновения протонов на коллайдере выглядят для детектора как набор разрозненных следов в разных подсистемах. Внутренний трекер фиксирует траектории заряженных частиц, калориметры измеряют энергию, оставленную в веществе детектора, мюонная система помогает выделять мюоны среди множества других частиц. Чтобы из этого набора сигналов перейти к физике, сначала нужно собрать итоговый список проявившихся частиц и их параметры. Именно на этом слое потом строятся измерения и поиски: от проверок Стандартной модели до охоты за новыми частицами.

В CMS больше 10 лет основу такой реконструкции составляет подход, который принято называть particle flow (поток частиц) - по сути это метод, который объединяет информацию всех подсистем и старается для каждого наблюдаемого следа понять, какой именно частице он соответствует. Он славится качеством, но цена за него тоже немаленькая: внутри спрятана длинная последовательность правил, эвристик и исключений, которые физики и разработчики шлифовали годами под реальное поведение детектора. Такой конвейер сложно радикально ускорять, а любые изменения требуют осторожности, потому что любой шаг в сторону влияет на всё остальное.

Новый алгоритм CMS устроен иначе. Вместо того чтобы прописывать, как именно сопоставлять треки с откликами калориметров, как разруливать неоднозначности и как собирать итоговые объекты шаг за шагом, команда обучает модель на симулированных столкновениях. Модель получает примеры того, как реальные частицы обычно проявляются в детекторе, и учится сразу выдавать полный результат реконструкции для события. Авторы сравнивают это с тем, как человек распознаёт лица: не по списку формальных правил, а по образцам, которые видел раньше, только здесь роль образцов играет симуляция.

Проверяли метод в условиях, похожих на те, в которых сейчас работает коллайдер. По общему уровню качества на таких тестах новая схема как минимум не уступила традиционной. Более того, в отдельных сценариях удалось прибавить. Самый наглядный пример связан со струями частиц. Струя появляется, когда, например, кварк или глюон рождается в столкновении и затем превращается в узкий пучок адронов. В симулированных событиях, где образуются топ-кварки, новый алгоритм улучшил точность восстановления струй на 10–20 процентов в ключевом диапазоне импульсов. Речь идёт о поперечном импульсе примерно от 30 до 100 ГэВ, то есть о зоне, которая часто оказывается рабочей для реальных анализов и заметно влияет на итоговую точность измерений.

Отдельная причина, почему в CMS вообще взялись за такую перестройку, связана не только с качеством, но и с вычислениями. Новый алгоритм можно эффективно запускать на графических процессорах, то есть на тех же типах чипов, которые давно используют для обучения нейросетей. Классические алгоритмы реконструкции обычно ориентированы на центральные процессоры, а они во многих задачах такого типа уступают по скорости, особенно когда нужен массовый параллелизм.

Медианное время работы нового метода составляет около 20 миллисекунд на событие на графическом процессоре Nvidia L4. Для привычной реконструкции на центральном процессоре в сопоставимых условиях указано примерно 110 миллисекунд. Здесь важно, что реконструкция выполняется для огромного потока данных, и даже десятки миллисекунд на событие быстро превращаются в серьёзные требования к вычислительному парку.

High-Luminosity LHC - обновленный коллайдер, который планируют запустить в 2030 году, должен дать примерно пятикратный рост числа столкновений. На практике это значит, что в каждый момент в детектор «сыпется» больше частиц сразу, потому что несколько событий накладываются друг на друга. В таких условиях детектор видит не отдельные аккуратные картины, а плотный слой сигналов, которые надо разложить по источникам. Это резко усложняет сопоставление треков и откликов калориметров и увеличивает объём вычислений.