Татаринова и хазары

Татьяна Татаринова — женщина-огонь. Американский профессор биоинформатики в Университете Ла Верн (University of La Verne) с множеством коллабораторов по всему миру — Франция, Россия, Филиппины, Малайзия, далее везде — она известна широким кругом научных интересов: геномика и генетика растений, медицинская генетика, популяционная… Татариновой много. Ее много не только в науке: она поет, пишет стихи, имеет черный пояс по карате, спасает бездомных собак, забиралась без страховки на Красноярские столбы. В Москву на конференцию «100 лет популяционной генетики человека» она приехала с докладом, посвященным генетике хазар и первому исследованию их геномов. PCR.news сделал развернутое интервью об этой работе.

Татьяна Татаринова читает лекцию в Физтехе. Летняя школа по биоинформатике 2017.

Фотография: Институт биоинформатики.

Татьяна, расскажи всю историю, как возникла идея секвенировать хазар, как проходила работа… (мы не на “вы”, поскольку Татаринова через три минуты после нашего знакомства три года назад предложила перейти на ты — А.Т.)

Интерес к хазарам у меня был давно. В 90-е годы я увлекалась Гумилевым. Хотя сейчас это считается дурным тоном, но мне Гумилев нравился: писал весело, а для человека, который далек от биологической науки, каким я была в 90-х, это звучало очень даже убедительно. Тогда я прочитала про хазар, отложилось, что интересный народ, пришел ниоткуда, ушел в никуда.

Потом мне попалась на рецензию статья, где авторы пытались доказать, что ашкенази-евреи произошли от хазар. Это была не совсем корректная работа. Там говорилось, что если за прокси хазар мы возьмем жителей Кавказа, а потом посмотрим, что у них есть похожесть на ашкенази-евреев, то это значит, что хазары были предками ашкенази-евреев.

Воин.jpg Хазарский воин. Рисунок Михаила Кристи.


Статья была на генетическом материале, или антропологическом и археологическом?

Генетическом, но на материале современных людей. То есть: если мы решим, что вот эти люди — потомки хазар, они похожи на вот тех, то те — потомки хазар тоже. Такой треугольник. Но это совершенно не факт. Генетическая похожесть народов не обязательно означает, что одни потомки других, а может говорить о том, что они выросли из одного средиземноморского набора людей. Статья про хазар мне запомнилась, но все время грыз червь, что доказательство неверное, такого типа логика: если мы решим, что бабушка — это дедушка, то тогда у бабушки есть яйца…

Потом мне попалось несколько книг. Есть такой археолог Владимир Ключников, он интересно пишет про историю хазар (Ивик, Ключников “Хазары” — А.Т.). Мы с ним списались, я спросила: «Есть ли у вас хазарские кости?» «Да у нас этих костей — мешками вывози!» — ответил.

В какие годы это было?

Лет пять назад. Ключников — из такой конторы в Ростове, называется «Донская археология». Он археолог-полевик, копает курганы, приносит кости антропологам, те проверяют, чтобы соответствовало антропологическому типу. Он работает с историком-антропологом Еленой Федоровной Батиевой. Очень классная женщина, которая знает про кочевников все. Она определяет антропологические типы, смотрит кости, их классифицирует.

И вот я сначала поговорила с Ключниковым, потом поговорила с Батиевой и сказала, что мне нужна хазарская знать. Потому что хазарская гипотеза подразумевает, что иудаизм приняла именно хазарская знать. Ну и если какие-то главные иудеи были из знати, то они могли передать свои хазарские гены ашкенази.

Мы отобрали порядка трехсот скелетов и начали их обрабатывать. В части скелетов у нас вообще нет никакой человечьей ДНК, она уже деградировала. Только бактериальная. Причем ДНК деградирует по-разному, потому что кости хранились в разных условиях — важно, где могила залегала, были ли грунтовые воды, замораживались ли и размораживались кости, могилы могли быть разграблены, кости могли вытаскивать дикие археологи… А у части скелетов был хороший состав. Мы из первой партии отобрали девять скелетов.

на мог.Жукова_Готова.jpg Елена Батиева на раскопках. Фотография: архив Елены Батиевой.


Что значит «мы»? Ты — биоинформатик. Тебе ведь нужен был «мокрый» биолог, так? Это ты организовывала все?

Да, да. Изначально я одна носилась с этой идеей. А потом я уже начала выходить на разных полезных людей. Игорь Корниенко, ростовский генетик, он в Минобороны трупы идентифицировал как судмедэксперт, такая веселая работа. Он понимает, как со скелетами работать, как оттуда вытаскивать ДНК, и у него свой интересный метод работы именно с деградированными ДНК.

Потом к нам в USC (Университет Южной Калифорнии, — А.Т.) с докладом приехал молодой ученый Саша Михеев. Тогда он работал на Окинаве (Окинавский Институт Науки и Технологии — А.Т.), а сейчас у него две лаборатории — на Окинаве и в Австралии. И он рассказал, что у него есть новый эффективный метод секвенирования древней ДНК. Не то, чтобы он сам с нуля придумал, он прочитал какую-то статью, а дальше — наука развивается постепенно — идея хорошая, «а что если еще сюда вот эту гайку прикрутим? Она будет еще лучше». В общем, он нашел, какую гайку прикрутить, и сделал метод, который секвенирует предпочтительно древнюю ДНК. Ведь какая проблема с древними ДНК? Ты секвенируешь все подряд, и у тебя в основном секвенируются бактерии. Поэтому уровень контаминации древней ДНК может доходить до 99,9%. Сделать так, чтобы ты секвенировал то, что тебе надо — это и есть экспериментальная наладка. Есть еще проблема: если хоть волосок твой или кусочек кожи войдет в этот раствор, то реакция будет предпочтительнее идти на твоей ДНК. А у него как раз такой метод, который позволяет находить и секвенировать именно старую ДНК.

Я ему говорю: «А что, если я тебе дам кости?» Он отвечает: «Я с человеком никогда не работал, я работал все время с пчелами». Я ему: «Саша, ну давай ты попробуешь». Он попробовал. Взял у нас первую партию образцов, ему показалось, что все получилось ужасно, и он полгода не выходил на связь.

Так, и что было после первой партии?

Саша расстроился. Я с ним столкнулась на конференции, спросила, как там наша хазарская ДНК? Он ответил: «Ой, все ужасно. Уровень бактериальной контаминации больше 95%!» Я ему: «Саш, так это ж хорошо!» — «Почему же это хорошо? У пчел нет контаминации…» — «Сравнил пчел и человеков. У человеков должна быть контаминация 99, а 95 — это хорошо». — «Да, на самом деле? Я думал, что это полное говно и я не могу ничего делать». Он отдал мне все данные, я ему: «Данные прекрасные, давай дальше». То есть, я его встряхнула, и процесс пошел.

А выделяют ДНК сейчас в основном в Ростове?

Сейчас уже и на Окинаве. Игорь Корниенко делает первый прогон в Ростове: выделение ДНК, анализ SТR-маркеров, определение пола и гаплогрупп. Потом пересылает дальше. А в прошлом году Игорь съездил на Окинаву, там у нас был мини-сход хазароведов. Мы две недели торчали на Окинаве и разработали протокол совместной работы. Игорь обучал ребят на Окинаве, как выделять ДНК из древних костей, объяснял лаборантам, что делать, чтобы не было контаминации. Какими-то кварцевыми лампами все заставил, в комнаты ставил дополнительные двери, чтобы там было отрицательное давление… Все не по-детски. Окинава только рада была. Они очень правильно относятся: если что-то идет на улучшение университета, они это делают. А там гораздо дешевле секвенирование, и у Саши есть финансовая поддержка университета. В России секвенировать очень дорого.

Михеев_Корниенко.jpg Александр Михеев (спереди) и Игорь Корниенко (сзади) в OIST (Окинава) обсуждают детали выделения древней ДНК. Фотография: архив Татьяны Татариновой.


Вы de novo делаете?

Нет, конечно. Человеческий референсный геном ведь у нас есть, делаем NGS. А дальше мы планируем проводить таргетное секвенирование определенных точек на геноме, которые для нас представляют интерес. Сейчас мы вырабатываем процедуру, чтобы сделать оптимальное разделение труда: кто и где выделяет, а кто секвенирует.

Основная идея нашего подхода в том, что нужно все делать параллельно. То есть ты не можешь, например, выделять ДНК в одном месте. Нужно взять одну кость и выделить в двух разных местах. Исключить контаминацию ты не можешь, но если у тебя разные люди работают с этой ДНК, и получился один и тот же результат, то, скорее всего это не контаминация. Хотя есть и методы биоинформатического исключения контаминации.

Как отличается контаминация в лаборатории от контаминации тем человеком, который копал?

Контаминация от археолога будет на поверхности костей. А верхний слой убирается. Внутри есть посторонние бактерии, но не ДНК копавшего. Но может быть, например, ДНК человека, который неаккуратно очищал кость в лаборатории. И если это будут разные люди, мы увидим. Особенно хорошо, если на Окинаве будут люди одной национальности, а в России — другой. У них будет разница по снипам, и ты можешь легко увидеть, кто это дело засорил. Или если кость девочкина — пусть мальчики делают. Было бы идеально, чтобы работали с костями азиатов, например, африканцы. Контаминацию от них было бы очень легко определить. Но где найти африканцев в Ростове?

Биоинформатику тоже делаете в разных местах?

Биоинформатические процедуры с файлами секвенирования — анализ ДНК, выравнивание на геном, определение снипов — мы делали в нескольких разных лабораториях. Я сама делала, мои аспиранты в одном месте, втором, третьем… У меня аффилиаций как у дурака фантиков, и в разных местах есть аспиранты и коллабораторы. Я их всех просила провести один и тот же анализ. У каждого немножечко свой метод нахождения вариантов.

А зачем? Зачем вообще биоинформатик нужен мокрым биологам, если существуют коммерческие платформы? Загрузил данные — получил результат…

Коммерческие платформы хорошо работают в идеальных условиях. Когда у тебя есть идеальный геном и есть идеальный кусок, рид, который идеально на этот геном ложится. Тогда тебе человек уже не нужен. Но древняя ДНК — вещь не идеальная. Она — вещь рваная и убитая. В ней есть куча ошибок. И как ее положить на геном?

Вот у тебя есть геном: современный человек, все очень хорошее. Ты секвенируешь много-много раз одно и то же. И у тебя есть какая-то ошибка, она может быть маленькая — три процента, пять процентов, один процент. И ты хочешь понять, какой у тебя тут вариант. Даже если у тебя в каком-то прочтении закралась ошибочка — А, а в других 99 прочтениях у тебя только Т, ты можешь сказать, что тут, скорее всего, Т. Все прекрасно.

А теперь у тебя древняя ДНК. Там полтора инвалида на одно место. И никогда не знаешь, у тебя на самом деле вариант, или это ошибка. Начинаешь играть с параметрами, и инструментов, которые тебе скажут с самого начала, что с этим делать, у тебя нет, с каждым участочком чуть ли не в ручную нужно работать, так как каждый убит по-своему.

И еще повторы…

Повторы тоже. В идеальной ситуации, когда нет повторов, когда все хорошо, ты это прекрасно делаешь. Как только начинаются какие-то сложности, то даже идеальный эксперимент с современным человеком работать уже не будет. А тут проблема в каждой точке. Какой выравниватель подобрать? Выравнивателей очень много.

И еще проблема в том, что древняя ДНК фрагментирована и концы этих фрагментов ДНК испорченные. В древних фрагментах к краям повышается количество переходов С в Т. Называется «усы древности». Откуда они растут? Изначально у нас туго заплетенная ДНК. Что происходит со временем? ДНК рвется и портится, она на концах расплетенная и незащищенная. На этих концах цитозин деаминируется в урацил и читается как тимин. То есть количество переходов С в Т на концах большое. И есть два подхода: ты можешь выравнивать с учетом того, что могут быть такие ошибки, или можешь обрезать концы, но тогда может не остаться вообще ничего по центру.

А вы снипы ищете…

Да! А это могут быть фальшивые снипы. Порча постмортем, которая совершенно ничего не говорит про то, какой нуклеотид у тебя был изначально. Поэтому мы делаем анализ разными методами, и я стараюсь, чтобы мои коллабораторы, разные-разные биоинформатики, не знали, что делают другие. «А с каким параметром делает Алексей?» — «А не скажу!» Давайте посмотрим вслепую, и уже потом будем выяснять. Поэтому мы все делаем в параллель. Понятно, что у нас не будет совпадений в сто процентов снипов. Но выводы… Исследуя ДНК, нельзя делать выводы по поводу каждого конкретного снипа. Например, вот очень дурацкий вопрос: «Были ли у них голубые глаза?». Потому что если мы говорим про какой-то ген, про какой-то снип, мы не знаем точно. У нас маленькое покрытие. Но если мы агрегируем это все вместе, например, по каким-то путям, то мы какие-то полногеномные вещи можем посмотреть. Мы используем разные методы, чтобы посмотреть происхождение по всему геному. Используем подход admixture — записываем как вектора в многомерном пространстве, сравниваем с референсной базой данных и с помощью этого определяем: у этого образца больше азиатской крови, у этого больше европейской крови, у этого смесь европейской с азиатской… Такие походы, агрегативные по всему геному, имеют смысл, а когда ты смотришь на каждый снип при таком ужасном уровне покрытия…

Ты организовала всю эту коллаборацию… Когда что-то получилось в первый раз?

Примерно полтора года назад. Тогда у нас получились пять геномов.

А референсные? Вы с чем сравнивали?

Мы собрали базу всех современных и всех древних образцов, которые были к тому моменту опубликованы. Это очень длинный и муторный процесс. Даже собирать данные из разных источников геморрой. Потому что все делают на своих платформах, собрать от экспериментов разных исследователей в одном месте — очень тяжелая задача. Просто дернуть из базы по дури нельзя.

Ну вот, получились первые пять геномов, но мы посчитали, что будет маловато, и взяли еще четыре. Сейчас мы как раз пишем статью по поводу девяти образцов. Они все показывают азиатскую смесь. Мы совершенно точно знаем, что это — правящий хазарский класс, тетьки-дядьки с богатым погребением. У каждого индивидуальный курган, разные могилы вдоль Дона восьмого-десятого веков. Бывало, хоронили с лошадью, особенно богатым клали верблюда. Откуда верблюд в Ростове? Это все-таки знак статуса, они ж не бегают там как бездомные собаки.

Схема_захоронения.jpg 

Схема хазарского захоронения в исполнении Михаила Кристи.



Сзема_рабочая.jpg Рабочее изображение хазарского погребения в исполнении Татьяны.


И что же показал анализ?

Один чувак, похоже, арабского происхождения, остальные больше азиаты. Один, может быть, смешанно азиатско-европейский, но азиатская компонента тоже сильная.

Что получается с теорией ашкенази-хазар? Вполне возможно, что кто-то из хазар мог и исповедовать иудаизм. Потому что там был полный плюрализм, они верили во что хочешь, никакого принуждения. Жили купцы всех религий и изо всех стран, горожане были полностью перемешаны. И, если помнишь, у Чингиз-хана тоже дети женились на разных принцессах. Так что я думаю, это вообще свойство кочевников. Они не придавали этому особого значения. У них были другие понты, типа, нужно жить в кибитке, в юрте, а кому ты при этом поклоняешься — неважно, хоть макаронному монстру.

Кто-то из хазар вполне мог принять иудаизм. Но то, что в массе они не могли быть предками ашкенази-евреев — это точно. Они несли слишком большой азиатский компонент, этого компонента в современных ашкенази нет.

Я видел в твоем докладе, получается всего несколько процентов совпадений. А сколько процентов нужно, чтобы уверенно говорить, что родство явное?

Если смотреть по маркерам, которые считают еврееспецифичными, и получить больше 50% совпадений, то я бы сказала, что, скорее всего что-то есть. А так как там одна сотая еле совпадает…

Сравнивали с современными ашкенази?

С современными. Была статья несколько лет назад, исследователи выложили специфичные маркеры ашкенази-евреев. У хазар их нет. А если есть, то на уровне случая. Хазары 400 лет командовали большим куском степи. Скорее всего, они захватили торговые пути и создали разным народам условия для торговли как в свободной экономической зоне. Так как кочевники жили в степях, то городам они не мешали. И торговцами могли быть кто угодно: арабы, славяне, евреи. В следующий раз мы хотим сделать проект с костями из городских могил. Там по идее должна быть интересная смесь народов.

И вот еще: было два типа хазар, белые и черные, о чем писали еще арабские историки. Мы не знаем, что это значит. Может быть, это были блондины и брюнеты, может быть, подчиненные и хозяева, азиаты и европейцы. Какое-то расслоение хазарского общества по неизвестному признаку. А то, что мы видим по нашему генетическому анализу, по крайней мере по тем скелетам, которые мы смотрели, — это поздний хазарский период — мы видим более-менее гомогенизированное общество. Мы видим смесь европейских и азиатских геномов, они уже сильно перемешались. Интересно, что тетки из могил, хазарские принцессы, или, не знаю, как там они назывались, — больше монголоиды. Это можно так объяснить: например, пришел ты, горячий армянский парень, и хочешь выслужиться, всех крошишь в мелкую капусту, тебя продвигают по службе, и ты можешь выслужиться в генералы и будешь похоронен вместе с главными хазарами. Но жениться ты должен именно на азиатской принцессе. Может быть, они брали себе жен из каких-то далеких кочевий, чтобы они были правильной крови. Поэтому женщины больше азиатского типа, а мужчины совершенно разные.

Когда ты говоришь про азиатский тип, это какая Азия?

Это юг Сибири, кочевой пояс. Нет ни одного народа, на который они были бы похожи идеально. Но примерно это якуты, буряты, кто-то похож на киргизов, на казахов... Большой сибирский набор.

Можно ли хоть что-то сказать про фенотип? Глаза какого цвета, например?

Очень приблизительно. Мы пробовали смотреть, я просила одного аспиранта это сделать, мы даже сравнили с фенотипической базой снипов... Очень скудно, к сожалению. Там же фрагментированные ДНК и их мало. Поэтому про конкретный аллель сказать ничего нельзя. Можно напридумывать, но это будет трындеж.

Кто-то до вашей команды делал сборку хазарских геномов?

Нет, это технически недостижимо и, по сути, не нужно, так как есть современный человеческий геном. Мы тоже геном не собирали. А вообще старая ДНК — это очень новая вещь, ее делать совсем недавно начали. И неандертальца совсем недавно сделали.

Как раз хотел спросить. Ты говорила в начале разговора, что кости были “убитые”, откуда ничего не выделить. А как же Сванте Паабо выделяет из фаланги пальца?

Не из всякой фаланги пальца можно выделить.

Ну, там древность-то какая, а здесь всего тысяча лет!

Все зависит от условий хранения. Вот мамонт якутский. Прекрасно сохранился. Он умудрился провалиться в снег, замерзнуть, и прекрасно сохранился. А теперь представь условия хранения у хазар: зимой минус сорок, летом плюс сорок. Опять же — грунтовые воды. Если скелет лежал в пещере с защищающим микроклиматом, то все могло сохраниться довольно долго.

Сколько стоит организация такой работы? Ты говорила, что денег мало.

Отсеквенировать человеческий геном стоит примерно 1000 долларов. А для того, чтобы еле-еле секвенировать древний геном, нужно в несколько раз больше, 5–10 тысяч долларов.

У тебя большая команда из разных стран. Как она организована? Финансово и управленчески?

У нас в команде человек десять. У нас нет единого гранта, но у каждого есть деньги на свою часть работы. Мы договариваемся. Почему мне нравится работать с Сашей Михеевым, кроме того, что он очень хороший специалист? Он человек хороший и у него есть фонды на его часть работы.

А ты сама?

Я же биоинформатик, мне гранты на мокрую лабораторию не нужны. Моя обязанность — делать математику.

Насколько принята такая организация работы?

Если ты посмотришь на статьи про древние ДНК, это всегда консорциумы. Деньги на международные проекты получить тяжело, а тем более при такой напряженке между Россией и Америкой. Америке с Японией получить грант, наверное, можно. Хотя мы подавали на грант с Японией, и не получили. И решили все делать своими силами.

Часто ты вступаешь в такие коллаборации? Работа по хазарам ведь только небольшая часть твоих активностей. Ты и с растениями работаешь, и с популяционной генетикой, ты мне в прошлый раз рассказывала о том, как с большой детализацией устанавливали региональные связи между людьми…

А, это я алгоритм разрабатывала, который к хазарам тоже применила.

…часто бывают такие сетевые коллаборации?

Да, часто. Например, у нас вышла статья три дня назад в коллаборации с французами. И до этого с малайцами. Еще у меня недавно вышла статья с филиппинцами, с институтом риса. Они делали секвенирование, я — свою биоинформатику. Я к ним, конечно, ездила туда, почему на Филиппины не съездить, там хорошо.

Своя лаборатория у тебя есть?

У меня три года назад в лаборатории было четыре очных аспиранта. И я вожжи отпустила... У одного из них появилась подруга в другой стране, финка. И он начал все время к ней ездить. Я его как-то пожалела и сказала: "Ну да, пусть он работает удаленно". На него начал смотреть другой, у которого тоже подруга в какой-то тьмутаракани... И остальные как-то перестали ходить на работу и вообще перестали работать. И я вдруг обнаруживаю, что сижу на работе одна и пытаюсь закончить проекты за всех уродов вместе взятых. Демократия, конечно, хорошая штука, но и аспирантов распускать нельзя.

Банда_ТТ.jpg  Банда ТТ. Самоописание Татариновой: «Наша группа называется Banda TT. Это русскодумающая калифорнийская группа, созданная методом тыка и исполняющая хиты собственного сочинения в стиле хардпоп и диско-треш. Группа отличается уникальным отсутствием баритонального сопрано у фронтмена, которая вообще-то фронтвумен. В текстах используются элементы утраченных языков неисследованных районов северной Антарктиды». Фотография: архив Татьяны Татариновой.

Добавить в избранное