Теперь наука официально принадлежит не только человеку?

Китайские исследователи представили искусственный интеллект, который способен самостоятельно выводить физические законы и формулы на основе необработанных данных. Система, получившая название PhyE2E, создана специалистами из университетов Цинхуа и Пекинского при поддержке ряда научных институтов.
Главная идея разработки — превратить ИИ из инструмента подгонки кривых в средство осмысленного открытия закономерностей. PhyE2E не просто строит статистические модели, а формулирует компактные математические выражения, согласованные по физическим единицам. То есть на выходе получается не абстрактная теория в виде обобщенных выводов, а уравнение, которое можно проверить, интерпретировать и использовать в научной работе.
Во время обучения система изучала реальные физические данные и известные уравнения. Алгоритм постепенно «понял», как выглядят правдоподобные формулы, уточняя их структуру и комбинируя различные варианты так, чтобы сохранялась размерность физических величин. В основе PhyE2E лежит архитектура трансформера, которая переводит данные напрямую в символьное выражение и соответствующие единицы измерения.
Чтобы справляться со сложными задачами, модель применяет стратегию разделения на подпроблемы. Она анализирует 2-е производные в вспомогательной нейросети и разлагает задачу на несколько простых уравнений. После этого выполняется короткая оптимизация с помощью методов поиска по дереву Монте-Карло и генетического программирования, которые уточняют численные коэффициенты и структуру итоговой формулы. В результате система выдаёт уравнение, которое не только описывает данные, но и имеет физический смысл.
Разработчики проверили PhyE2E на синтетических наборах данных и на реальных проектах с расчетами NASA. В 5 задачах, связанных с космической физикой, нейросеть вывела уравнения, совпадающие с формулами, полученными людьми, а в некоторых случаях — более точно описывающие те или иные явления. Например, при анализе архивных данных NASA за 1993 год PhyE2E предложила уточнённое математическое выражение для описания солнечных циклов, а также выявила взаимосвязи между солнечным излучением, температурой и магнитным полем.
Авторы проекта отмечают, что система учится не просто подгонять значения, а искать логические цепочки, сохраняющие физический смысл. Она опирается на знания, накопленные в виде уже известных уравнений, и предлагает новые комбинации, которые не нарушают законов размерности. По сути, PhyE2E объединяет возможности больших языковых моделей и символьной математики, превращая машинное обучение в инструмент научного анализа.
В будущем разработку планируют использовать для обработки экспериментальных и астрофизических данных, где часто встречаются нелинейные связи и шум. Также исследователи собираются расширить архитектуру модели, добавив поддержку операций дифференцирования и интегрирования, что позволит ей выводить уравнения в частных производных — основу большинства физических теорий.
Создатели PhyE2E видят в этом шаг к «предсказуемому ИИ», который способен не только делать прогнозы, но и объяснять, как и почему они получаются. Такой подход, считают они, может изменить сам принцип научного поиска: вместо подбора формул — автоматическое открытие закономерностей, которые человек потом сможет проверить и не тратить время впустую на пути к величайшим открытиям.