Машина уже знает, что и когда с вами случится — осталось только дождаться.
Исследователи представили ИИ‑модель Delphi‑2M, способную предсказывать риск развития более чем 1200 заболеваний с горизонтом до 20 лет вперёд. Это первый инструмент на основе большого языкового трансформера, который моделирует траектории здоровья сразу по множеству диагнозов — от рака и аутоиммунных нарушений до болезней кожи.
Delphi‑2M использует медицинские карты, возраст, пол, индекс массы тела и поведенческие факторы — включая курение и потребление алкоголя — чтобы оценить вероятности наступления 1258 заболеваний. Модель обучалась на базе данных 400 тысяч участников британского проекта UK Biobank и, по словам авторов, показала сопоставимую или лучшую точность по сравнению с существующими прогнозными алгоритмами, нацеленными на отдельные нозологии.
Авторы доработали архитектуру GPT — генеративного предобученного трансформера, аналогичного тем, что лежат в основе систем вроде ChatGPT, — и адаптировали её к задачам долгосрочного медицинского прогнозирования. В отличие от ранее созданных специализированных моделей, фокусирующихся на единичных болезнях, Delphi‑2M способна формировать целостные карты здоровья, охватывающие десятилетия, и автоматически выявлять множество потенциальных угроз.
По словам одного из авторов, Моритца Герстунга из Немецкого центра онкологических исследований, новая система снимает необходимость запускать десятки разрозненных инструментов при анализе каждого пациента.
Особенно хорошо Delphi‑2M справляется с предсказанием заболеваний, имеющих чётко выраженные закономерности развития, например некоторых форм рака. При этом модель может варьировать срок прогноза в зависимости от полноты и глубины входных медицинских данных — вплоть до 20 лет.
Её эффективность подтверждена тестами на отдельной базе из 1,9 миллиона записей Датского национального регистра пациентов, который содержит историю госпитализаций с 1970‑х годов. Несмотря на то, что данные отличались по структуре и не участвовали в обучении, точность прогнозов снизилась лишь незначительно, что указывает на потенциальную переносимость модели на другие медицинские системы.
Однако, как отмечает Дэгуи Чжи из Университета здравоохранения Техаса, есть и ограничения: в частности, UK Biobank учитывал только первое зафиксированное проявление болезни у человека, тогда как реальная динамика — рецидивы, осложнения и коморбидность — важна для точного построения индивидуальных траекторий. Также остаётся открытым вопрос, насколько Delphi‑2M учитывает временные связи между событиями, влияние редких состояний и возможные перекрёстные зависимости между заболеваниями.
Несмотря на это, инструмент уже показал себя как одна из самых перспективных разработок в области прогнозирования заболеваний. Следующим шагом станет валидация модели на клинических данных из других стран и дальнейшая калибровка под различные популяции. Авторы подчёркивают, что даже при текущем уровне развития Delphi‑2M может стать полезным инструментом для врачей и систем здравоохранения — прежде всего в контексте раннего выявления групп риска и внедрения превентивных мер задолго до появления симптомов.