Улучшенный метод определения родства по сегментам ДНК идентичного происхождения протестировали на диких макаках
Изучение генетического родства играет важную роль во многих исследованиях, но точность его оценки до сих пор остается низкой. Группа под руководством немецких ученых разработала и протестировала программное обеспечение, позволяющее точно оценивать степень родства по данным полногеномного секвенирования с низким покрытием, в которых можно сопоставить идентичные по происхождению сегменты ДНК.
Биологическое родство определяется наличием у двух и более особей идентичных аллелей, унаследованных от общего предка, и выступает ключевым фактором в исследованиях поведения, структуры популяции и эволюции признаков внутри нее. Случайная рекомбинация во время мейоза и распределение хроматид ведут к непрерывному распределению степени родства, за исключением пар «родитель-потомок», где потомку всегда передается один аллель, и монозиготных близнецов, имеющих идентичные аллели.
В предыдущих исследованиях популяций животных родство характеризовалось связями, соединяющими особей в рамках родословной, и соответствующим средним значением распределения общего аллеля. Но такой подход не затрагивает изучение непрерывного изменения генетического родства внутри родственных классов.
Зачастую для оценки родства используются генетические биомаркеры, например, генетическая изменчивость в коротких тандемных повторах (STR). Но оценки на основе STR опираются на небольшое количество биомаркеров, а значит, не обладают достаточной статистической точностью, а их результаты не могут учитываться при дальнейшем анализе. Высокопроизводительное секвенирование позволило создать панели однонуклеотидных полиморфизмов (SNP), при помощи которых ученые рассчитывают единую оценку генетического родства по всему геному. Этот метод не учитывает дальних родственников, однако позволяет определить идентичные по происхождению сегменты ДНК (identical-by-descent, IBD), количество, распределение длины и положение которых в сочетании с вычислительными моделями предоставляет уникальные возможности исследования природных популяций. В связи с этим возрастает необходимость расширять области обнаружения IBD сегментов в естественных популяциях.
Международный коллектив под руководством ученых из Германии для наиболее точного определения генетического родства разработал биоинформатический пайплайн с различными вычислительными методами оценки IBD на основе данных полногеномного секвенирования ДНК (WGS) популяции макак-резусов (Macaca mulatta) на острове Кайо-Сантьяго, Пуэрто-Рико.
Для анализа авторы отобрали данные WGS 103 особей (57 самок и 46 самцов), выбранных в качестве репрезентативной подгруппы родословной, охватывающей 12 поколений. Секвенирование проводилось с разной глубиной покрытия для проверки и оптимизации созданного вычислительного пайплайна. При помощи программного обеспечения ancIBD, разработанного специально для данных секвенирования с небольшой глубиной покрытия, определили все сегменты IBD, разделенные на два типа: IBD1 — две особи имеют один общий аллель; IBD2 — особи имеют два общих аллеля.
Проверка производительности на данных WGS с разной глубиной покрытия показала высокую (свыше 90%) точность определения количества и длины сегментов IBD1 и IBD2 даже при минимальной эффективной глубине покрытия (0,5х).
Для оценки фактического родства (rIBD) и вычисления процента общей ДНК между 98 особями (4753 парами) исследователи суммировали длину общих сегментов IBD на пару и разделили ее на общую диплоидную длину генома макаки. Полученные данные rIBD сравнивали с фактическими родством, вычисленным на основе родословной (rPED) и на основе STR (rSTR). Анализ показал, что эмпирическое распределение rIBD в высокой степени согласуется с ожидаемыми значениями родства, основанными на моделировании rSTR и rPED, что указывает на способность методов на основе IBD точно измерять биологический градиент родства. Также исследователи обнаружили несколько пар особей, которые на основании rPED были определены как неродственные, но имели идентичные длинные сегменты IBD, а значит можно предположить, что эти пары имеют общих предков, и методы, основанные на IBD, позволяют наиболее точно выявить эти связи без данных о родословной.
Ученые также выявили значительную разницу в показателях скорости рекомбинации между полами, которая у самок оказалась примерно в 1,5 раза выше, чем у самцов, — это может указать на пол неизвестных предков и на связь пары особей через материнскую или отцовскую линию.
Разработанный пайплайн продемонстрировал высокую производительность и точность определения родства, а методы, основанные на IBD, позволяют выявить значительные биологические различия в родстве, выходящие за рамки того, что может быть определено только из родословных или данных об STR. Такая возможность достоверного измерения фактического родства предоставляет исследователям мощный и доступный инструмент для понимания роли биологических родственных связей.
Анализ древней ДНК опроверг гипотезу «экологического самоубийства» жителей острова Пасхи
Меню
Все темы
0






