Модель AlphaGenome — генетический ИИ-конструктор стал ещё удивительнее.
Google DeepMind представила AlphaGenome — новый инструмент на основе искусственного интеллекта, который помогает значительно глубже понять, как устроен человеческий геном и какие последствия могут иметь даже незначительные изменения в ДНК. С его помощью исследователи смогут точнее прогнозировать, как отдельные варианты и мутации в генетическом коде влияют на работу клеток, регуляцию генов и развитие болезней.
Геном — это своего рода инструкция для всех клеток организма. Последовательность ДНК определяет не только внешние характеристики человека, но и то, как функционируют органы, как организм реагирует на окружающую среду и насколько он подвержен различным заболеваниям. Однако расшифровка того, как именно "читается" эта инструкция, остаётся одной из самых сложных научных задач. Особенно трудно понять, как на клеточные процессы влияет появление небольшой мутации в определённом участке ДНК.
AlphaGenome призвана восполнить эти пробелы. Эта модель ИИ обрабатывает длинные участки генома — до одного миллиона нуклеотидов за раз — и предсказывает тысячи биомолекулярных характеристик, связанных с регуляцией генов. Система анализирует, где расположены гены и где они заканчиваются в разных типах тканей, какие участки ДНК открыты для доступа белков, где происходит сплайсинг РНК и насколько активно вырабатываются молекулы РНК.
Для обучения модели были использованы огромные объёмы данных из международных научных проектов, включая ENCODE, GTEx, 4D Nucleome и FANTOM5. Эти исследования экспериментально изучали работу генетического материала у человека и мышей, охватывая сотни типов клеток и тканей и предоставляя уникальные данные о регуляции генов.
Архитектура AlphaGenome представляет собой сложную многоуровневую систему. Вначале свёрточные слои модели выявляют повторяющиеся паттерны в последовательности ДНК. Затем блок трансформеров анализирует связи между отдалёнными участками цепочки, позволяя учитывать влияние регуляторных элементов, находящихся далеко друг от друга. Финальные слои преобразуют полученную информацию в конкретные прогнозы, охватывающие широкий спектр биологических процессов. Все вычисления распределяются между специализированными процессорами TPU, что позволяет эффективно обрабатывать большие массивы генетических данных.
Разработка AlphaGenome стала развитием предыдущих моделей DeepMind, таких как Enformer и AlphaMissense. Если последняя фокусируется на интерпретации мутаций в кодирующих участках ДНК (которые составляют всего 2% генома), то новая модель впервые позволяет столь подробно и точно анализировать некодирующие области, играющие ключевую роль в регуляции активности генов. Именно в этих регионах часто скрываются генетические варианты, связанные с предрасположенностью к заболеваниям.
AlphaGenome отличается рядом уникальных возможностей:
Тестирование AlphaGenome на эталонных наборах данных показало впечатляющие результаты. При анализе одиночных последовательностей модель превзошла существующие решения в 22 из 24 задач. А при оценке влияния мутаций на регуляцию генов AlphaGenome показала лучшие или сопоставимые результаты в 24 из 26 тестов. Принципиально важно, что в отличие от других моделей, AlphaGenome способна одинаково эффективно решать сразу весь комплекс задач, а не только узкоспециализированные из них.
Точные прогнозы AlphaGenome открывают широкие перспективы для разных направлений исследований:
Разработчики уже опробовали систему на примере реального биомедицинского кейса. С помощью AlphaGenome удалось смоделировать механизм, связанный с лейкемией T-ALL. Система показала, что мутации в определённом участке ДНК активируют онкоген TAL1 через создание дополнительного сайта связывания белка MYB, что подтверждается данными медицинских исследований.
AlphaGenome позволяет учёным одновременно оценивать влияние мутации сразу на множество биологических процессов. Раньше для этого требовалось использовать несколько отдельных моделей. Благодаря такому комплексному подходу исследователи могут быстрее выдвигать и проверять научные гипотезы.
Несмотря на успехи, модель пока имеет ограничения. Например, AlphaGenome затрудняется точно учитывать влияние очень удалённых регуляторных элементов, находящихся более чем за 100 тысяч нуклеотидов от интересующего участка. Также модель не предназначена для персонализированных генетических прогнозов и не даёт полного объяснения, как мутации приводят к сложным заболеваниям, ведь на это влияют и другие биологические факторы, включая развитие организма и воздействие окружающей среды.
Google DeepMind подчёркивает, что AlphaGenome не предназначена для медицинских целей. Модель создана для научных исследований и уже доступна через API для некоммерческого использования. Учёные со всего мира могут использовать систему в своих проектах, а также отправлять предложения по улучшению модели.
AlphaGenome — это лишь первый шаг. Архитектура модели гибкая и может масштабироваться. В будущем планируется расширение возможностей за счёт увеличения обучающего набора данных, включения других видов биологической информации и адаптации модели для изучения геномов других видов.
По мнению разработчиков и независимых экспертов, AlphaGenome станет важным инструментом для науки и поможет глубже понять, как генетические изменения влияют на работу организма, ускорит исследования в области медицины и генетики и приблизит учёных к разгадке сложнейших тайн ДНК.
Лечим цифровую неграмотность без побочных эффектов