Пока GPT пишет второсортные анекдоты, этот ИИ взялся за науку по-взрослому.

Нейросети давно стали частью повседневной цифровой среды, но чаще всего их используют для привлечения внимания, генерации однотипного контента или продвижения сервисов. Новая разработка Европейского космического агентства показывает иной вектор развития искусственного интеллекта: от развлечений и маркетинга к фундаментальной науке и исследованию Вселенной. В центре этого проекта находится нейронная сеть AnomalyMatch, созданная специально для поиска редких и атипичных космических объектов в огромных массивах астрономических данных.
Алгоритм разработали исследователи ESA Давид О'Райан и Пабло Гомес. Архитектура системы ориентирована на выявление статистически редких структур, которые выходят за рамки стандартных морфологических шаблонов. В качестве обучающей выборки использовались примеры необычных астрономических явлений: галактики-медузы с вытянутыми газовыми хвостами, гравитационные дуги, сложные системы взаимодействующих галактик, а также другие нетипичные формы, возникающие под действием гравитации и динамики межгалактической среды.
Первым полигоном для проверки технологии стал архив Hubble Legacy Archive, совместный проект ESA и NASA, в котором за более чем 35 лет накоплены десятки тысяч наборов наблюдений космического телескопа Хаббл. Этот массив охватывает широкий спектр астрономических целей: от близких галактик до далёких скоплений, от туманностей до гравитационно-линзированных объектов. Общий объём данных давно превысил возможности ручного анализа даже для крупных исследовательских групп.
AnomalyMatch проанализировала около 100 млн фрагментов изображений из этого архива всего за два с половиной дня. Для сравнения, подобная работа вручную заняла бы у астрономов годы непрерывной обработки. В результате система выделила сотни потенциальных аномалий, которые затем прошли дополнительную экспертную проверку.
После верификации исследователи подтвердили существование примерно 1 400 реальных аномальных объектов, среди которых около 800 ранее не фигурировали в научных каталогах. В этот список вошли галактики со сложной деформированной формой, системы с признаками слияния, структуры, искажённые гравитационным линзированием, а также редкие примеры галактик-медуз. Отдельно были выделены 86 новых кандидатов в гравитационные линзы, 18 объектов с характерной морфологией (в английском она называется jellyfish) и 417 систем, находящихся в процессе взаимодействия или слияния.
Практический эффект такого подхода заключается не только в самих находках, но и в принципиально новой модели работы с большими данными. Современные обсерватории генерируют объёмы информации, которые уже невозможно полноценно анализировать традиционными методами. Даже опытные астрономы физически не способны просматривать миллиарды изображений, поэтому значительная часть редких явлений остаётся незамеченной в архивах.
Развитие таких инструментов становится особенно актуальным на фоне новых проектов. Космический телескоп Euclid, начавший обзор миллиардов галактик в 2023 году, и обсерватория имени Веры Рубин, которая за ближайшие 10 лет должна накопить более 50 петабайт изображений, сформируют массивы данных, несоизмеримые с предыдущими поколениями наблюдений. Без автоматизированных интеллектуальных систем поиск редких объектов в таких объёмах информации будет практически невозможен.
В перспективе подобные нейросети могут стать стандартной частью научной инфраструктуры, помогая выявлять новые типы космических структур, расширять каталоги редких явлений и открывать ранее неизвестные физические процессы, скрытые в массивных хранилищах данных.