Очень длинные геномные последовательности могут быть следствием ошибки нанопорового секвенирования

На конференции Oxford Nanopore Day 2022 доклад «Являются ли чтения Oxford Nanopore Technologies длиннее миллиона нуклеотидов результатами технических ошибок?» представил Михаил Щелкунов (Институт проблем передачи информации им. А.А. Харкевича РАН).

Щелкунов начал с обсуждения заявления ONT о возможности получения ридов длинyее 4 Мб. Однако лаборатория докладчика за все время работы с MinION не получала ридов такой длины. Максимальный рид достиг 600 Кб и был получен при анализе кишечной палочки, однако он был похож на микросателлитную последовательность и, по-видимому, не имел никакого отношения к истинному геному организма. Есть предположение, что длинные последовательности, так называемые псевдомикросателлиты, возникают, если в поре нет ДНК. Еще одна проблема — химеры. Они образуются, когда через пору с малым временным интервалом проходят два разных генома.

Михаил Щелкунов решил подробно изучить проблему длинных ридов. Он скачивал наборы геномных данных и искал в них риды длиннее 1 Мб. Всего нашлось 116 таких ридов в трех базах, содержащих человеческие геномы.

Затем с помощью вычислительных методов докладчик искал потенциальные химеры — ими оказались 17,2% найденных длинных ридов. В двух ридах более 98% последовательностей были похожи на микросателлиты. Не исключено, что в геноме человека есть области, насыщенные микросателлитами, но Щелкунов скептически относится к такому предположению. Тем не менее 81,9% всех последовательностей не были ни химерами, ни псевдомикросателлитами. Это хорошая новость, но докладик призывает не радоваться преждевременно при получении очень длинных ридов с помощью нанопоры.

Добавить в избранное

Вам будет интересно