DeepMind ковыряется в ДНК, как в сломанном механизме. Проблема в том, что механизм — это мы

DeepMind ковыряется в ДНК, как в сломанном механизме. Проблема в том, что механизм — это мы

Модель AlphaGenome — генетический ИИ-конструктор стал ещё удивительнее.

image

Google DeepMind представила AlphaGenome — новый инструмент на основе искусственного интеллекта, который помогает значительно глубже понять, как устроен человеческий геном и какие последствия могут иметь даже незначительные изменения в ДНК. С его помощью исследователи смогут точнее прогнозировать, как отдельные варианты и мутации в генетическом коде влияют на работу клеток, регуляцию генов и развитие болезней.

Геном — это своего рода инструкция для всех клеток организма. Последовательность ДНК определяет не только внешние характеристики человека, но и то, как функционируют органы, как организм реагирует на окружающую среду и насколько он подвержен различным заболеваниям. Однако расшифровка того, как именно "читается" эта инструкция, остаётся одной из самых сложных научных задач. Особенно трудно понять, как на клеточные процессы влияет появление небольшой мутации в определённом участке ДНК.

AlphaGenome призвана восполнить эти пробелы. Эта модель ИИ обрабатывает длинные участки генома — до одного миллиона нуклеотидов за раз — и предсказывает тысячи биомолекулярных характеристик, связанных с регуляцией генов. Система анализирует, где расположены гены и где они заканчиваются в разных типах тканей, какие участки ДНК открыты для доступа белков, где происходит сплайсинг РНК и насколько активно вырабатываются молекулы РНК.

Для обучения модели были использованы огромные объёмы данных из международных научных проектов, включая ENCODE, GTEx, 4D Nucleome и FANTOM5. Эти исследования экспериментально изучали работу генетического материала у человека и мышей, охватывая сотни типов клеток и тканей и предоставляя уникальные данные о регуляции генов.

Архитектура AlphaGenome представляет собой сложную многоуровневую систему. Вначале свёрточные слои модели выявляют повторяющиеся паттерны в последовательности ДНК. Затем блок трансформеров анализирует связи между отдалёнными участками цепочки, позволяя учитывать влияние регуляторных элементов, находящихся далеко друг от друга. Финальные слои преобразуют полученную информацию в конкретные прогнозы, охватывающие широкий спектр биологических процессов. Все вычисления распределяются между специализированными процессорами TPU, что позволяет эффективно обрабатывать большие массивы генетических данных.

Разработка AlphaGenome стала развитием предыдущих моделей DeepMind, таких как Enformer и AlphaMissense. Если последняя фокусируется на интерпретации мутаций в кодирующих участках ДНК (которые составляют всего 2% генома), то новая модель впервые позволяет столь подробно и точно анализировать некодирующие области, играющие ключевую роль в регуляции активности генов. Именно в этих регионах часто скрываются генетические варианты, связанные с предрасположенностью к заболеваниям.

AlphaGenome отличается рядом уникальных возможностей:

  • Система обрабатывает длинные фрагменты ДНК с сохранением высокой точности на уровне отдельных нуклеотидов, что позволяет учитывать влияние регуляторных участков, расположенных далеко от изучаемого гена.
  • Модель предсказывает широкий набор биомолекулярных параметров одновременно, включая сплайсинг РНК, экспрессию генов, взаимодействие белков с ДНК и пространственную организацию молекулы.
  • За считанные секунды AlphaGenome способна оценить влияние мутаций, сравнивая изменённые участки ДНК с их изначальной версией и прогнозируя последствия для регуляции генов и работы клеток.
  • Впервые реализовано точное моделирование процессов сплайсинга — механизма удаления ненужных фрагментов РНК. Ошибки на этом этапе часто становятся причиной тяжёлых заболеваний, таких как спинальная мышечная атрофия или отдельные формы муковисцидоза.

Тестирование AlphaGenome на эталонных наборах данных показало впечатляющие результаты. При анализе одиночных последовательностей модель превзошла существующие решения в 22 из 24 задач. А при оценке влияния мутаций на регуляцию генов AlphaGenome показала лучшие или сопоставимые результаты в 24 из 26 тестов. Принципиально важно, что в отличие от других моделей, AlphaGenome способна одинаково эффективно решать сразу весь комплекс задач, а не только узкоспециализированные из них.

Точные прогнозы AlphaGenome открывают широкие перспективы для разных направлений исследований:

  • Система поможет точнее определять потенциально опасные генетические варианты, включая редкие мутации, что критически важно для изучения наследственных заболеваний и поиска новых методов лечения.
  • Модель может использоваться для проектирования искусственных ДНК-фрагментов, активирующих или подавляющих работу генов в определённых клетках — это важно для синтетической биологии и биомедицинских технологий.
  • AlphaGenome упрощает идентификацию ключевых регуляторных участков генома, ответственных за работу клеток и тканей, что ускоряет фундаментальные исследования.

Разработчики уже опробовали систему на примере реального биомедицинского кейса. С помощью AlphaGenome удалось смоделировать механизм, связанный с лейкемией T-ALL. Система показала, что мутации в определённом участке ДНК активируют онкоген TAL1 через создание дополнительного сайта связывания белка MYB, что подтверждается данными медицинских исследований.

AlphaGenome позволяет учёным одновременно оценивать влияние мутации сразу на множество биологических процессов. Раньше для этого требовалось использовать несколько отдельных моделей. Благодаря такому комплексному подходу исследователи могут быстрее выдвигать и проверять научные гипотезы.

Несмотря на успехи, модель пока имеет ограничения. Например, AlphaGenome затрудняется точно учитывать влияние очень удалённых регуляторных элементов, находящихся более чем за 100 тысяч нуклеотидов от интересующего участка. Также модель не предназначена для персонализированных генетических прогнозов и не даёт полного объяснения, как мутации приводят к сложным заболеваниям, ведь на это влияют и другие биологические факторы, включая развитие организма и воздействие окружающей среды.

Google DeepMind подчёркивает, что AlphaGenome не предназначена для медицинских целей. Модель создана для научных исследований и уже доступна через API для некоммерческого использования. Учёные со всего мира могут использовать систему в своих проектах, а также отправлять предложения по улучшению модели.

AlphaGenome — это лишь первый шаг. Архитектура модели гибкая и может масштабироваться. В будущем планируется расширение возможностей за счёт увеличения обучающего набора данных, включения других видов биологической информации и адаптации модели для изучения геномов других видов.

По мнению разработчиков и независимых экспертов, AlphaGenome станет важным инструментом для науки и поможет глубже понять, как генетические изменения влияют на работу организма, ускорит исследования в области медицины и генетики и приблизит учёных к разгадке сложнейших тайн ДНК.

Антивирус для мозга!

Лечим цифровую неграмотность без побочных эффектов

Активируйте защиту — подпишитесь