МД-2021, день 1. Древняя ДНК

На секции «Древняя ДНК. Реконструкция подлинной истории человечества» обсуждали тонкости манипуляций с ДНК из древних образцов и биоинформатического анализа данных. Почему российские археологи вступают в коллаборации с зарубежными генетиками? Чем отличалось население раннесредневековой Рязани от населения Твери? Азиаты ли скифы и евреи ли хазары?

Изображение:

Скифские лучники. Керчь

Credit:

PHGCOM - photographed at Musée du Louvre, CC BY-SA 3.0, https://commons.wikimedia.org/

Перед началом секции участники почтили минутой молчания память Олега Балановского, заведующего лабораторией геномной географии ИОГен РАН, трагически погибшего летом 2021 года.

В первом докладе Харис Мустафин (Московский физико-технический институт, Москва) рассказал, как в МФТИ организована лаборатория для исследования археологической ДНК и какие задачи она решает. Геномный центр был создан 10 лет назад, и сразу возникли планы по изучению истории населения Руси и сопредельных территорий. Россия не лидирует в этой области, археологи обычно обращались на запад в поисках коллабораций, и было решено восполнить этот пробел.

Необходимое оборудование имелось, но надо было решить проблему контаминации. В покое от человека каждую минуту отрывается до 300 тысяч частиц, сопоставимых по количеству ДНК с древними образцами; при движении до трех миллионов. Чтобы избежать загрязнения, нужны чистые помещения, скафандры. «Я по образованию физик и решил воспользоваться физическими приемами», — объяснил Харис Мустафин. Поскольку объекты, из которых выделяют ДНК, небольшие, для их размещения на самом деле не нужны целые комнаты. В МФТИ создали лабораторию с замкнутой системой перчаточных боксов, соединенных шлюзовыми камерами. Это позволило решить и проблему воздухообмена: самые лучшие системы фильтрации не очищают воздух от мелких частиц, а такие камеры можно вакуумировать или заполнить сверхчистым азотом. В них очищают и измельчают образцы, выделяют ДНК. Все остальные процедуры — ПЦР, фрагментный анализ, NGS — проводят на другом этаже, в геномном центре.

Далее Харис Мустафин рассказал о некоторых исследованиях. Первым было захоронение двух людей из XVII века, найденное в Радонеже под Сергиевым Посадом: мужчина, у которого на груди лежала молодая девушка, как оказалось, его дочь. Русское средневековье — не самый благоприятный вариант с точки зрения сохранности ДНК, но в МФТИ постепенно привыкали с ней работать. Среди других локаций — Ярославль, XIII век, массовое погребение на Стрелке горожан, убитых во время нашествия Батыя (70 человек); Тверь, та же эпоха (50 человек); Водская земля под Великим Новгородом (около 20). В Крыму в районе Бахчисарая нашли два захоронения XIV века, в каждом около 30 обезглавленных людей — трудный случай для антропологов, но генетики смогли определить гаплотипы. Удивительно, что некоторые убитые оказались женщинами, но при этом очень рослыми, а палеопатологическое исследование их скелетов обнаружило признаки тяжелой работы.

Загадочная находка была сделана во время раскопок в Тайницком саду Московского Кремля, когда строили президентскую вертолетную площадку. В подполе обрушенного дома обнаружили останки мужчины и женщины, которая прижимала к себе ребенка, со следами сильной термической нагрузки. Ребенок оказался сыном женщины, мужчина не был их родственником. Митохондриальные гаплогруппы указывали на среднюю полосу России, при этом на остатках одежды женщины и вещах ребенка были вышиты суры из Корана. Возможно, эти люди погибли во время нашествия Тохтамыша в XIV веке.

Со временем археологи начали передавать на исследование более древние образцы, например, из Пепкинского кургана XII–X века до н.э. (абашевская культура), где захоронено множество людей со следами боевых ранений: оказалось, что там погребены как местные обитатели, так и представители другого народа — видимо, враги, погибшие в одной битве. Также в МФТИ исследовали мумифицированное тело скифского времени (VII век до нашей эры, Ээрбек, верховья Енисея), как предполагали, мальчика 12–14 лет, с луком, стрелами и колчаном, в шубке из меха тушканчика, погребенное в колоде из ствола лиственницы, Но молодой воин оказался девочкой.


Обширные выборки из средневековых русских городов позволили воссоздать картины генетической структуры населения. Например, Ярославль по Y-гаплогруппам показал довольно высокое разнообразие, с выраженным влиянием мерян и скандинавских народов, Тверь была более однородной. Аналогичную картину, но с более низким разнообразием, давали гаплогруппы мтДНК.

Помимо фрагментного анализа (STR) лаборатория использует и таргетное секвенирования для выявления однонуклеотидных полиморфизмов (SNP, или снипов). Недавно заказали реактивы Roche, набор Expert Human Affinities компании Arbor для исследования большого количества снипов. Такой уровень исследования ДНК позволит соответствовать топовым мировым результатам. «У нас есть самое главное — фантастические археологические материалы», — сказал Харис Мустафин.

Доклад Егора Прохорчука (Центр «Биоинженерия» РАН, Москва) назывался «Палеогенетика объектов бронзового века: от математики к политике». Самая большая база древней ДНК, содержащая 7000 образцов, — это коллекция Дэвида Райха из Гарвардского университета. На территории РФ таких исследований практически не делается, образцы вывозятся за рубеж, и наши археологи жалуются, что их не допускают до интерпретации данных при написании совместных статей. По мнению докладчика, интерес к древней ДНК имеет политическую окраску. Он даже сослался на археолога Густафа Коссинну, чьи исследования использовались нацистской пропагандой. «Мы рассматриваем свою лабораторию как инструмент в руках археологов», — сказал Егор Прохорчук. Задача генетиков — подтверждать или не подтверждать их гипотезы, но конечный вывод должны делать археологи.

Далее докладчик пояснил преимущества и недостатки двух технологий исследования древней ДНК. Трэппинг — исследование множества SNP по всему геному человека с помощью специальных панелей — позволяет избавиться от бактериальной ДНК, в отличие от шотган-секвенирования. Шотган-секвенирование дает много информации, но чем больше в образце бактериальной ДНК (а ее обычно много), тем больше денег придется потратить, чтобы получить секвенирование с приличным покрытием.

Отдельный вопрос — насколько сопоставимы результаты, полученные тем и другим методом. Например, в базе Райха 80% данных — трэппинг, 20% — шотган. Сравнивать их сложно, один и тот же образец, исследованный двумя методами, дает разные результаты, в чем докладчик с коллегами убедились на собственном опыте.

Как известно, при работе с древней ДНК важно избегать загрязнения современной человеческой ДНК. Короткие фрагменты – это хорошо, отметил докладчик; присутствие длинных, недеградированных участков говорит о контаминации. Другой характерный признак древней ДНК — «усы древности»: дезаминированные цитозины на концах фрагментов, которые переходят в уридины, в результате эти участки содержат много замен С в Т.

Интересный вариант применения шотган-секвенирования — эпигенетические исследования древней ДНК. Как известно, в деградирующей ДНК преимущественно сохраняются фрагменты, которые были в нуклеосомах (та же ситуация, что и с циркулирующей ДНК). Это позволяет выяснить, есть ли нуклеосомы в промоторах того или иного гена, то есть какие гены были активны у человека, жившего тысячи лет назад.

Затем докладчик коснулся математических методов, с помощью которых обрабатываются данные секвенирования, и пояснил на примерах из их собственной практики, как они работают: «Моя лаборатория четко состоит из людей мокрых и людей сухих. Ни одни без других существовать не могут».

Виды статистики f2 f3, f4 — аналитические инструменты, которые анализируют частоты аллелей в сравниваемых популяциях и позволяют делать выводы о характере отношений между ними: произошла ли одна популяция от смешения двух других, когда произошло разделение популяций и т.п.

Метод главных компонент PCA основан на уменьшении размерности данных — в случае популяционной генетики многомерное пространство снипов проецируется на плоскость. При визуализации данных каждый образец представлен точкой, и их кластеризация наглядно показывает генетическое сходство.

Анализ предковых компонент ADMIXTURE выявляет происхождение индивидов изучаемой популяции от некоторого числа предковых популяций (нет необходимости изначально предполагать, каких именно) и представляет результат в графическом виде — как ряд столбиков, состоящих из разноцветных сегментов, что позволяет визуально оценить гетерогенность этой группы людей. Это может быть достаточно сложной задачей: докладчик привел пример, когда анализ для 13 предполагаемых предковых популяций занял восемь дней работы Курчатовского вычислительного кластера.

Егор Прохорчук подчеркнул, что результаты анализа ADMIXTURE для образцов из курганов майкопской культуры (Северный Кавказ, бронзовый век), полученные ими — методом шотган-секвенирования, и в другой работе — методом трэппинга SNP, оказались несходными. Даже для одного и того же образца они не совпали, что возвращает к вопросу о сопоставимости результатов.

В заключение докладчик выразил надежду, что количество российских групп, которые занимаются подобными исследованиями, будет расти.


Игорь Корниенко (Южный научный центр РАН, Ростов-на-Дону) сделал короткое сообщение, посвященное особенностям пробоподготовки и выделения древней ДНК. В древних образцах, как правило, содержатся сверхмалые количества ДНК — иногда единичные копии геномов, к тому же сильно деградированные. Часто в них содержатся стабильные, то есть трудно устранимые ингибиторы ПЦР, например, гуминовые и фульвовые кислоты. Их можно определить методом УФ-спектроскопии. Особенно вредны фульвовые кислоты: в отличие от гуминовых, они растворимы в воде. Еще одна проблема — продукты реакции Майяра (сахароаминной конденсации).

К сожалению, стандартные протоколы работы с ДНК в этих случаях малоэффективны, приходится возвращаться к мануальным методам выделения. Они включают лизис с помощью детергентов, протеиназную обработку и восстановление дисульфидных связей, далее следует собственно экстракция ДНК или сорбция на стекловолоконных фильтрах либо на силике. Детергенты удаляют на колонках; это важный этап, поскольку, например, SDS — мощный ингибитор полимеразы.

Игорь Корниенко привел пример с анализом ДНК мамонта (возраст 32,5-33 тыс. лет). По результатам выделения мануальный фенольный метод оказался намного эффективнее покупного набора для экстракции ДНК. В итоге был успешно секвенирован участок мтДНК мамонта.

Затем в режиме онлайн выступил член-корреспондент РАН Евгений Рогаев. К артефактам и объектам культуры, памятникам письменности теперь добавились последовательности древней ДНК, сказал он. Вопреки стихотворению Бунина, гробницы, мумии и кости больше не молчат, они сами стали текстами.

Помимо полногеномного секвенирования (также говорят о «широкогеномном секвенировании», имея в виду, что геном секвенируется не целиком, но охвачены маркеры по всему геному), древнюю ДНК можно исследовать методами криминалистики — изучать STR-маркеры, мтДНК.

Не все костные останки одинаково хорошо подходят для исследования: лучшие источники ДНК —  каменистая часть височной кости, слуховые косточки (молоточек, наковальня, стремечко). Но иногда удается получить ДНК из малоподходящих объектов. Например, когда генетиков попросили идентифицировать срезанные волосы, спрятанные в портрете цесаревича Алексея, удалось подтвердить их принадлежность самому цесаревичу. Хотя ДНК была сильно деградированная и ридов было мало, авторы исследования смогли получить, в частности, уникальные участки мтДНК королевы Виктории. (Об идентификации останков семьи Николая II, которую проводили Рогаев с коллегами, см интервью со Светланой Боринской.)

Еще одна интригующая история — анализ ДНК из двух необычных образцов XIX века: волосатой женщины Заны, пойманной в лесах Абхазии, которую криптозоологи считали снежным человеком, и ее сына Хвита. Анализ мтДНК показал общую у Заны и Хвита гаплогруппу L2b1b, характерную для народов Африки южнее Сахары.

Метод подготовки библиотек для полногеномного секвенирования, применяемый в лаборатории Рогаева, хорошо работает для коротких фрагментов 100-150 нуклеотидов, типичных для древней ДНК. Шотган-секвенирование таких библиотек позволяет быстро определять видовую принадлежность древних костных останков. Это делалось, например, для костей животных из Мезмайской пещеры в Краснодарском крае, где нашли неандертальцев. Височная кость человека оказалась принадлежащей зубру, зато человеческий зуб определили как неандертальский; это стало первым исследованием ДНК неандертальца на территории России. Новый неандерталец из Мезмайской пещеры кластеризуется с другим неандертальцем, обнаруженным здесь же; он жил 60-70 тыс. лет, его ближайший родственник — польский неандерталец из пещеры Стайня.

Исследователи разработали подход, позволяющий разбить на гаплотипы все неандертальские митохондриальные геномы. «Как ни странно, этого особо никто не делал», — отметил Рогаев. На основе такого анализа создали филогенетическое дерево, которое включает все существующие данные неандертальцев, в том числе и те, что с плохим качеством чтения.

Евгений Рогаев тоже коснулся вопроса гармонизации геномных данных, полученных различными методами. Чтобы анализировать древние этнические группы, группа Рогаева собирают данные из всех баз по современным и древним популяциям, при этом, конечно, используются разные типы данных, и надо искать подходы, позволяющие их согласовывать.

Одна из текущих задач, над которыми работают Евгений Рогаев с коллегами, — исследование происхождения скифов. Происхождение этого народа, жившего на обширных территориях от Китая до Причерноморья с VIII по III век до нашей эры, до сих пор неясно. К северной части скифского мира относятся могильники и курганы Воронежской области, например, захоронение так называемых скифских амазонок (правда, по крайней мере одна из них оказалась мальчиком). Всего их исследовано около 90 образцов, для некоторых проведены полногеномные анализы. Для скифов горного Алтая (пазырыкская культура) получены полные митохондриальные геномы, и их гаплогруппы оказались «европейскими». А вот по результатам PCA пазырыкцы находятся где-то между популяциями Средней Азии и Волго-Урала. «Воронежские» же скифы относятся к европейской группе и не пересекаются с азиатами.

Также исследуются русские ранние средние века, в частности, коллективное захоронение в Ярославле, о котором уже шла речь. Метод главных компонент показывает, что древние ярославцы кластеризуются в Восточную и Центральную Европу.

В заключение Рогаев отметил, что крайне важно интегрировать анализ митохондриальных геномов, Y-хромосомы с полногеномным или широкогеномным анализом: эти методы дополняют друг друга.

Татьяна Татаринова (Университет Ла-Верна, Калифорния, США) рассказала о закрытии «хазарской гипотезы». До сих пор популярна версия, согласно которой хазары, тюркоязычный кочевой народ, в середине VII века создавший собственное огромное государство — Хазарский каганат — являются предками евреев ашкенази. Письменных хазарских источников, которые могли бы подтвердить или опровергнуть эту версию, нет. В ее пользу говорят иудейские артефакты, связанные с хазарами, иудейские имена правителей, предания об иудейских обычаях хазар. Однако генетические исследования ее так и не подтвердили. (См. интервью с Татьяной Татариновой на PCR.NEWS.)

Чтобы быть уверенными, что исследуемые останки принадлежат именно хазарам, для анализа выбирали богатые захоронения — такие в которых погребен один человек, с лошадью или верблюдом, оружием и разнообразной утварью. Как заметила Татаринова, знатные хазары вели активную жизнь: на скелетах множество рубленых ран, некоторые — не зажившие.

Моноэтническим хазарское общество явно не было: например, четверо имели «европейскую» гаплогруппу Y-хромосомы R1, двое — «азиатскую» C3. Кочевое племя вбирало в себя разные субстраты. Когда Игорь Корниенко провел аутосомный STR-анализ, получилось то же самое: различные гаплогруппы, разное происхождение. Возможное загрязнение образцов современной ДНК проверяли по сигналу от Х-хромосомы (нет ли сигнала от двух и более; образцы были в основном мужские). Секвенировали на приборах Illumina.

Образцы были различного качества, это был первый опыт работы с образцами такой древности, в итоге получили «много геномов с плохим покрытием», как сказала докладчица. Однако биоинформатические методы все же позволили получить достаточно много информации. Покрытие, как обычно, было более высоким для мтДНК, и ее анализ тоже указывал на большое разнообразие популяции. Этому соответствовали данные РСА: образцы занимали промежуточное положение между востоком и западом и не формировали компактного кластера, среди них были и «азиатские», и «европейские». Сходные результаты показала f3-статистика.

ADMIXTURE тоже построили, при этом использовали различные подходы и методы, в том числе разработанные в лаборатории Татариновой GPS (инструмент биогеографического анализа) и reAdmix. Эти исследования позволили посмотреть, на каких современных людей похожи хазарские вожди.

Для этого прежде всего необходимо было собрать современные референсные группы (это отдельная нетривиальная задача). Алгоритм reAdmix представляет индивида смешанного происхождения как комбинацию минимального количества векторов эталонных популяций (не обязательно предковых, можно брать и предполагаемых потомков). Известно было, что метод работает как на современных людях, так и на древних: например, удалось подтвердить, что на юге Европы больший вклад в геном людей бронзового века внесли анатолийские фермеры, на севере — охотники-собиратели.

Хазары оказались сходными с разными современными популяциями: кто-то с европейскими, а кто-то был похож на бурятов, якутов, кетов и удмуртов. Прослеживалось сходство с данными, полученных на Y-хромосоме и мтДНК. Если говорить о древней ДНК, некоторое сходство наблюдалась с образцами раннего сарматского железного века. Результаты анализа не поменялись, когда вместо референсой панели Национального географического общества, взяли другую, Human Origin, где снипов в 4 раза больше, а затем еще более обширную. Четыре образца оставались «европейцами», два «азиатами», еще два были сильно смешанными. Однако никакой кластеризации с евреями ашкенази обнаружить так и не удалось.

Те же результаты подтвердил еще один алгоритм, который предсказывал для каждого снипа наиболее вероятное происхождение, а потом с помощью алгоритма Витерби соединял их в одну цепочку по хромосоме, чтобы понять, какие локусы от кого пришли.

«Очень хочется переделать секвенирование», — сказала в заключение Татьяна Татаринова. Но и те данные, что удалось получить, подтверждают, что среди знатных хазар были группы европейского и азиатского происхождения, родственные самым разным современным группам.

Информация о докладчиках

Харис Харрасович Мустафин, руководитель лаборатории исторической генетики, радиоуглеродного анализа и прикладной физики, Московский физико-технический институт, Москва

Егор Борисович Прохорчук, д.б.н., профессор, Центр «Биоинженерия» РАН, Москва

Игорь Валериевич Корниенко, д.б.н., главный научный сотрудник Южного научного центра РАН, заведующий лабораторией «Идентификация объектов биологического происхождения» Академии биологии и биотехнологии ЮФУ (Ростов-на-Дону)

Евгений Иванович Рогаев, д.б.н., член-корреспондент РАН, ФГБУН «Институт общей генетики им. Н.И. Вавилова» РАН, Москва

Татьяна Валерьевна Татаринова, PhD, University of La Verne, California, USA

Добавить в избранное

Вам будет интересно