В тканях человека и животных найдено более 2500 новых вирусов

Американские ученые разработали биоинформатический алгоритм, с помощью которого выявили и внесли в общедоступную базу данных 2 514 новых вирусных геномов, 609 из которых не имеют никакого сходства с известными последовательностями.

Credit:
Kateryna Kon | Shutterstock.com

Предполагается, что в природе могут существовать миллионы вирусов, среди которых есть патогены человека и животных, однако в базе данных GenBank каталогизировано всего около 9 000. Вирусологи из Национального института онкологии (США) с коллабораторами значительно расширили базу: они провели масштабный метагеномный анализ тканей человека и значимых для человека животных для выявления последовательностей вирусов с кольцевым геномом. Идея новой работы, опубликованной в eLife, выросла из предыдущих подходов к поиску папилломавирусов и полиомавирусов  в кожных соскобах и комплексных образцах тканей.

Ученые проанализировали образцы от 23 видов животных, включая человека, нематоду, мышь, дрозофилу и других. Из тканей выделяли вирионы, затем обогащали вирусные геномы с помощью амплификации по типу катящегося кольца со случайными праймерами. После подготовки библиотек проводили секвенирование на платформах Illumina MiSeq или NextSeq500.

Полученные последовательности обрабатывались с помощью алгоритма Cenote-Taker, разработанного одним из авторов статьи. Из ридов de novo собирались контиги. Предположительные кольцевые последовательности размером более 1 000 нуклеотидов сравнивались с базой данных GenBank для исключения сиквенсов с большим сходством (более 90%) с известными последовательностями. Также отсеивались плазмидные геномы. Оставшиеся последовательности считались неизвестными ранее вирусными геномами и преобразовывались в формат, совместимый с GenBank.

Команда обнаружила 2 514 новых вирусных ДНК в животных метагеномах. 1 844 из них несли гены, схожие с белок-кодирующими генами вирусов с одноцепочечной ДНК (оцДНК) и 55 генов, схожих с белок-кодирующими генами вирусов с двухцепочечной ДНК (дцДНК). 868 геномов имели сходство с CRESS-вирусами эукариот. 670 геномов принадлежали представителям семейства маленьких бактериофагов Microviridae (ученые отмечают, что в GenBank хранятся геномы только 459 вирусов этой группы). В человеческой крови было обнаружено более 100 различных последовательностей анелловирусов, информации о безобидности или вреде которых пока недостаточно.

Некоторые новые CRESS-вирусы оказались большего размера, чем описанные ранее. В некоторых случаях это было связано с дупликацией капсидных генов. Также ученые детектировали события рекомбинации между CRESS-вирусами, оцРНК-вирусами и оцДНК-бактериофагами. Это позволяет предположить, что CRESS-вирусы стоят в центре запутанной вирусной эволюции.

609 контигов не имели сходства ни с одним из сиквенсов базы. Принадлежность генома вирусу определяли с помощью нейросети, которая идентифицировала гены, предположительно кодирующие белки вирусных капсидов. Некоторые из этих белков при экспрессии в клетках человеческой линии 293TT и Escherichia coli формировали частицы, похожие на вирусные.

Новые вирусные последовательности загружены в публичную базу GenBank. Пока неясно, какое влияние эти вирусы оказывают на здоровье человека и животных, однако ученые считают, что результаты работы должны лечь в основу кооперации врачей и ученых для определения этого влияния. Расширение баз вирусных геномов даст возможность для высокопроизводительной каталогизации виросферы.

Источник

Michael J Tisza, et al. // Discovery of several thousand highly diverse circular DNA viruses. // eLife 2020;9:e51971; DOI: 10.7554/eLife.51971
Добавить в избранное