Аннотация генома нового коронавируса

Исследователи из Китайского центра по контролю и профилактике заболеваний (CCDC) и их коллеги выполнили детальную аннотацию генома коронавируса 2019-nCoV. Аннотирование выявило важные различия между 2019-nCoV и вирусами, сходными с возбудителем тяжелого острого респираторного синдрома SARS-CoV.

Credit:
NMDC | NPRC 2020.00002

В статье, опубликованной в Cell Host & Microbe, рассказывается об аннотировании геномов 2019-nCoV и сравнениии их с геномами нескольких других вирусов SARS и SARS-подобных вирусов. Сравнение выявило 380 аминокислотных замен, которые, возможно, отвечают за функциональные особенности 2019-nCoV.

Коронавирусы подразделяются на четыре основных рода: альфа-, бета-, гамма- и дельтакоронавирусы. Ранее было идентифицировано шесть коронавирусов человека: альфакоронавирусы HCoV-NL63 и HCoV-229E и бетакоронавирусы HCoV-OC43, HCoV-HKU1, SARS-CoV и возбудитель ближневосточного респираторного синдрома (MERS-CoV).

Геномы коронавирусов имеют размеры 6 000–32 000 оснований; геном может включать 6–11 открытых рамок считывания (ORF). Первая ORF занимает около 67% всего генома и кодирует 16 неструктурных белков (к ним относится вирусная протеиназа, которую рассматривают как примитивную мишень лекарств), остальные — вспомогательные и структурные белки. Четыре основных структурных белка — поверхностный гликопротеин S (spike), оболочечный белок E (envelope), белок M и нуклеокапсидный белок N. Гликопротеин S играет важную роль в связывании с рецепторами на клетке хозяина; причем у SARS-CoV и MERS-CoV это не одни и те же рецепторы, и с ними взаимодействуют разные рецептор-связывающие домены S-белка. SARS-CoV использует в качестве одного из основных рецепторов ангиотензинпревращающий фермент 2 (ACE2), в качестве альтернативного CD209L; MERS-CoV — дипептидилпептидазу 4 (DPP4, она же CD26). Скорее всего, новый коронавирус также взаимодействует с ACE2 (см. публикацию в Journal of Virology и препринт на BioRxiv).

Авторы работы выполнили подробные аннотации на первых трех геномах 2019-nCoV — HB01, HB04 и HB05 — и сравнили их с родственными коронавирусами, включая 1008 человеческих SARS-CoV, 338 SARS-подобных CoV летучих мышей и 3131 человеческих MERS-CoV.

На уровне аминокислотных последовательностей белков 2019-nCoV похож на SARS-CoV, но есть и заметные различия. Например, белок 8а есть в SARS-CoV, но отсутствует в 2019-2019-nCoV; белок 8b в SARS-CoV состоит из 84 аминокислот, а в 2019-2019-nCoV — из 121, а белок 3b, напротив, у SARS-CoV существенно длиннее (154 аминокислоты против 22). Пока неясно, как эти различия влияют на функциональность и патогенез нового вируса.

Филогенетический анализ подтвердил принадлежность 2019-nCoV к той же кладе коронавирусов, что и MERS-CoV, SARS-CoV, SARS-CoV-подобные вирусы летучих мышей, при наибольшем сходстве с последними и наименьшем — с MERS-CoV. Аналогичные результаты получила другая группа китайских исследователей; их статья опубликована в The Lancet в конце января (подробнее на PCR.news). Однако авторы не обнаружили какого-то одного штамма SARS-подобного вируса летучей мыши, все белки которого обладали бы максимальным сходством с аналогами 2019-nCoV.

«Учитывая тесную связь между 2019-nCoV и SARS-CoVs или SARS-подобными вирусами летучих мышей, изучение аминокислотных замен в разных белках может пролить свет на структурные и функциональные отличия 2019-nCoV от коронавирусов SARS», — пишут авторы. — Всего обнаружено 380 аминокислотных замен между аминокислотными последовательностями 2019-2019-nCoV (HB01) и соответствующими консенсусными последовательностями SARS и SARS-подобных вирусов». Интересно, что аминокислотных замен по сравнению с SARS-CoV не было в мотивах, которые непосредственно взаимодействуют с человеческим рецептором ACE2, однако шесть мутаций присутствовало в других участках рецептор-связывающего домена.

Кстати, в конце прошлой недели Институт геномики (Калифорнийский университет в Санта-Крузе) опубликовал геном 2019-nCoV на геномном браузере университета, визуализировав данные из Национального центра биоинформатики Национальных институтов здравоохранения США (NCBI). «Когда мы отображаем данные о коронавирусе в UCSC Genome Browser, это позволяет исследователям посмотреть на структуру вируса и, что более важно, поработать с ним, чтобы они могли понять, как именно хотят его атаковать», — сказал инженер UCSC Genome Browser Хирам Клоусон. Браузер позволяет аннотировать геном, что дает ученым возможность работать совместно и обмениваться полученной в экспериментах информацией.

Источник

Aiping Wu, et al. // Genome Composition and Divergence of the Novel Coronavirus (2019-nCoV) Originating in China. // Cell Host & Microbe, 2020, February 07, 2020; DOI:  10.1016/j.chom.2020.02.001

Добавить в избранное