Как нейросеть обыграла суперкомпьютеры.
Учёные из международной команды, куда вошли специалисты из Итальянского национального института астрофизики (INAF), Университета Пармы и Университета Ватерлоо (Канада), разработали эмулятор Effort.jl для моделирования крупномасштабной структуры Вселенной.
Речь идёт об одной из самых сложных задач космологии: описании «космической паутины» — гигантской трёхмерной сети, где галактики образуют скопления и сверхскопления, соединённые нитями и разделённые пустотами. Для её анализа применяют модель EFTofLSS (эффективная теория поля крупномасштабной структуры), которая статистически описывает распределение материи во Вселенной и позволяет вычислять её ключевые параметры. Но эта модель требует огромных вычислительных ресурсов , а объём астрономических данных постоянно растёт — пример тому свежие массивы от проекта DESI или миссии *Euclid*.
Чтобы сократить время обработки , используются эмуляторы. Они не решают уравнения заново, а «подражают» тому, как ведёт себя модель, выдавая близкие результаты в десятки или сотни раз быстрее. Effort.jl , созданный командой, стал значительным шагом вперёд: он работает за минуты на обычном ноутбуке вместо недель на суперкомпьютере и при этом сохраняет точность.
Как поясняет первый автор исследования, Марко Боничи из Университета Ватерлоо, эффективная теория поля похожа на описание воды в стакане. В принципе можно рассмотреть движение каждой молекулы или атома, но это непрактично: число вычислений растёт лавинообразно. Вместо этого можно зафиксировать ключевые микроскопические свойства и проследить их влияние на макроскопическом уровне — в данном случае, на движение всей жидкости. Так же и EFTofLSS описывает Вселенную: мелкомасштабные физические процессы закодированы в параметрах, а сама теория работает со структурой в целом.
Effort.jl базируется на нейросети , которая обучается на результатах настоящей модели, а затем предсказывает её ответы для новых комбинаций параметров. В отличие от аналогов, новый эмулятор использует уже известные сведения о том, как меняются предсказания при изменении параметров, — это встроено в алгоритм с самого начала. Кроме того, он учитывает градиенты, то есть направление и величину изменений при малом сдвиге параметра. Всё это сокращает объём обучающей выборки и ускоряет процесс.
Главный вопрос при использовании таких сокращённых путей — можно ли доверять результату? Авторы показывают, что точность Effort.jl на синтетических и реальных данных совпадает с исходной моделью. Более того, иногда эмулятор позволяет включить те части анализа, которые в обычных расчётах приходилось отбрасывать ради ускорения.