Модель AlphaGenome — генетический ИИ-конструктор стал ещё удивительнее.
Google DeepMind представила AlphaGenome — новую модель искусственного интеллекта, которая помогает лучше разобраться, как именно функционирует геном человека и к чему могут привести мельчайшие изменения в его структуре. Этот инструмент позволяет учёным точнее прогнозировать влияние отдельных мутаций и вариантов ДНК на работу клеток, активность генов и развитие заболеваний.
Геном можно сравнить с инструкцией, по которой строится и функционирует организм. Последовательность ДНК определяет не только внешние черты, но и работу органов, реакции на окружающую среду и предрасположенность к болезням. Однако расшифровать, как эта информация интерпретируется внутри клеток, учёным до сих пор удаётся лишь частично. Особенно сложно понять, как случайные изменения на небольших участках ДНК могут повлиять на здоровье.
AlphaGenome как раз создана для того, чтобы восполнить эти пробелы. Система способна анализировать длинные последовательности генетического кода — до миллиона нуклеотидов за раз — и прогнозировать тысячи биологических показателей, связанных с активностью генов. Она помогает определить, где именно начинаются и заканчиваются гены в разных типах тканей, какие участки ДНК доступны для взаимодействия с белками, где происходит сплайсинг РНК и насколько активно клетки синтезируют РНК-молекулы.
Чтобы обучить модель, специалисты использовали массивы данных из крупнейших международных проектов: ENCODE, GTEx, 4D Nucleome и FANTOM5. Эти исследования охватывают сотни типов клеток у человека и лабораторных животных и предоставляют уникальную информацию о работе генетического материала.
Архитектура AlphaGenome построена на многоуровневом принципе. Сначала свёрточные слои выявляют повторяющиеся элементы внутри последовательности. Затем блоки трансформеров анализируют связи между удалёнными фрагментами ДНК, что позволяет учитывать влияние регуляторных участков, находящихся далеко от изучаемого гена. Финальные слои превращают собранные данные в конкретные прогнозы о работе клеток. Все вычисления распределяются между мощными процессорами TPU, благодаря чему система быстро справляется с анализом огромных объёмов информации.
Новая модель развивает идеи предыдущих проектов DeepMind, таких как Enformer и AlphaMissense. Если последняя была сосредоточена на анализе кодирующих участков ДНК — составляющих лишь около 2% всего генома — то AlphaGenome впервые позволяет столь подробно изучать некодирующие фрагменты, которые играют ключевую роль в регуляции активности генов. Именно там часто скрываются изменения, связанные с риском заболеваний.
AlphaGenome отличается сразу несколькими важными возможностями:
Тесты AlphaGenome показали впечатляющие результаты. При анализе одиночных участков генетического кода модель превзошла существующие решения в 22 из 24 задач. При оценке влияния мутаций на активность генов система показала лучшие или сопоставимые результаты в 24 из 26 тестов. В отличие от более узкоспециализированных моделей, AlphaGenome справляется с комплексным анализом сразу по нескольким направлениям.
Эти возможности открывают широкие перспективы:
AlphaGenome уже была опробована на примере реальной медицинской задачи. С её помощью учёные смоделировали механизм, связанный с лейкемией T-ALL. Система показала, что мутации в определённой области ДНК активируют онкоген TAL1 за счёт появления дополнительного сайта связывания белка MYB — что подтверждают независимые исследования.
Благодаря AlphaGenome учёные могут одновременно отслеживать влияние мутаций сразу на множество биологических процессов — ранее для этого приходилось использовать несколько разрозненных моделей. Такой подход ускоряет проверку научных гипотез и поиски новых закономерностей.
Несмотря на успехи, AlphaGenome пока не лишена ограничений. Например, ей сложно учитывать влияние очень удалённых регуляторных элементов, расположенных на расстоянии более 100 тысяч нуклеотидов от интересующего участка. Кроме того, модель не подходит для персонализированной медицины и не объясняет в полном объёме, как мутации вызывают сложные заболевания — на это влияют и другие факторы: особенности развития организма и воздействие внешней среды.
В DeepMind подчёркивают, что AlphaGenome создана исключительно для научных исследований . Модель уже доступна через API для некоммерческого использования, а учёные со всего мира могут подключаться к проекту и предлагать улучшения.
AlphaGenome — только начало. Архитектура системы гибкая и масштабируемая. В будущем её планируют расширить: добавить больше обучающих данных, включить другие типы биологической информации и адаптировать модель для изучения геномов разных видов.
По мнению специалистов, AlphaGenome станет важным шагом в изучении влияния генетических изменений на здоровье, ускорит фундаментальные исследования и приблизит науку к разгадке ключевых тайн ДНК.
В Матрице безопасности выбор очевиден