1,7 млн вирусных геномов в одной базе: учёные создали самую полную карту невидимой армии, которая правит планетой

1,7 млн вирусных геномов в одной базе: учёные создали самую полную карту невидимой армии, которая правит планетой

База VIRE объединила данные из каждого уголка Земли: от морских глубин до кишечника.

image

Учёные представили VIRE — колоссальную базу, объединяющую около 1,7 млн вирусных геномов, полученных из более чем 100 000 метагеномных наборов данных, собранных по всему миру. Подобные массивы формируются при полном секвенировании всей ДНК, присутствующей в образце, будь то морская вода, почва или человеческий микробиом. Такой подход особенно важен для изучения организмов, которые невозможно вырастить в лабораторных условиях: большинство вирусных частиц и значительная доля микробов до сих пор известны лишь благодаря их генетическим следам, а не наблюдаемым культурам.

Проектом руководили Пир Борк из Европейской лаборатории молекулярной биологии в Гейдельберге и Сугуро Нисидзима из Токийского университета, ранее работавший в группе Борка. Исследователи стремились создать ресурс, который охватывал бы как медицинские, так и природные сообщества, отражая вирусные процессы в максимально широком спектре сред.

Название VIRE расшифровывается как Viral Integrated Resource across Ecosystems — «интегрированный ресурс вирусов в различных экосистемах». По масштабам и наполнению это крупнейшая на сегодняшний день коллекция вирусного генетического материала. Она даёт основу для осмысления того, насколько разнообразны вирусные популяции и как они распределены между организмами, биомами и климатическими зонами. Создатели считают, что новый инструмент позволит значительно продвинуть исследования, посвящённые экологическим ролям вирусов и их взаимодействию с микробными сообществами, от обитателей морских глубин до представителей кишечной флоры.

Хотя учёные давно знают, что вирусы встречаются буквально в каждом уголке планеты, целостной картины их многообразия до сих пор не существовало. Особую сложность вызывает изучение бактериофагов — вирусов, заражающих бактерий. Эти агенты играют ключевые роли в динамике микробных систем, но огромная часть их разновидностей остаётся недоступной классическим методам, поскольку не поддаётся культивированию. Из-за этого биологи годами сталкиваются с пробелами в понимании того, насколько широко распространены такие вирусы и какие функции выполняют в природных нишах и организме человека.

Команда применила современные алгоритмы поиска вирусных последовательностей для анализа генетического материала из разных типов сред — от океанов до почвы и всех основных зон человеческого тела. Системы классифицировали найденные геномы, определяли их возможных хозяев и выясняли функции кодируемых ими белков. Важную часть работы заняли вычислительные методы, позволяющие отделить вирусные фрагменты от бактериальной ДНК и выявлять редкие последовательности с высокой точностью.

Для вирусов, заражающих бактерий и архей, использовали специфический инструмент биологической памяти — спейсерные последовательности CRISPR. Эти фрагменты генетического материала сохраняются в микробных геномах после перенесённых инфекций и работают как архив прежних атак. Сопоставив такие записи с вирусными геномами, авторы смогли с большой точностью определить, какие микробные линии становились мишенями соответствующих вирусов. Помимо этого, функции вирусных генов уточнялись с помощью интеграции данных из нескольких крупных биологических баз — включая KEGG и COG, описывающих метаболические пути, белковые домены и эволюционные связи.

Созданный ресурс открывает возможности для исследований, затрагивающих экологию вирусов, формирование микробных сообществ, влияние окружающей среды на генетическое разнообразие и многие аспекты здоровья человека. По мнению авторов, работа закладывает основу для более глубокого понимания того, как вирусные популяции формируют биологические процессы на планете и как эти влияния меняются на фоне глобальных сдвигов климата и урбанизации.