Юлия Медведева: «Биоинформатика поменяется, потому что она привязана к технологиям»
В идеальном мире люди тратят заметное время на свое самообразование, постепенно осознают, что собственное здоровье — это зона ответственности самого человека, а не врачей, перестают говорить бездоказательные глупости, критически осмысляют поступающую информация и перестают заниматься странными вещами вроде междоусобных конфликтов. А в науке развивается глобальная коллаборация, ученые и управленцы в науке перестают бояться собственных теней и начинают понимать, что данные — это общечеловеческое достояние.
Текст создан в рамках проекта «Завлабы»: редакция PCR.NEWS задает вопросы руководителям лабораторий, отделов и научных групп. Что бы вы сделали, если бы были всемогущи? Как должен выглядеть идеальный мир через 50 лет? Что вам не дает покоя? Какому главному правилу вы можете научить начинающих исследователей? И так далее.
Биоинформатические предсказания, конечно, сбываются, но не так часто, как хотелось бы. Мы сейчас делаем проект, поддержанный РНФ, и там была проделана большая вычислительная работа, связанная с обработкой значительных объемов экспериментальных данных. Мы предсказывали функции некодирующих РНК для эпигенетической регуляции. В результате у нас появились РНК-кандидаты, про которых мы, кажется, понимали, как они работают. А потом мы их проверили экспериментально — и правда так. Это было очень радостно, но неожиданно. Было очень азартно разбирать эти механизмы дальше. Проект развивается до сих пор.
У нас идет проект с медиками из Эндокринологического центра, в котором мы анализируем особенности иммунной системы в разных этносах. Нам в первую очередь интересны этнические различия у здоровых людей, а во вторую очередь — специфика протекания в этносах диабета 2 типа. Это очень большой проект, в нем используется много нетривиальных технологий, можно на одной руке пересчитать тех, кто в России делает подобное. Сложно было все это организовать, начиная с менеджерских задач — договориться, чтобы врачи подобрали пациентов, найти здоровых людей, организовать обработку образцов на месте, там, где собираем, — и заканчивая анализом транскриптома и эпигенома единичных клеток, это тоже оказалось нетривиально.
Делать по одному человеку очень дорого, мы объединяем пробы. И если смешать клетки крови в пробирке и подержать не 15 минут, а несколько часов, то иммунные клетки начинают друг на друга реагировать, клетки приобретенного иммунитета активируются сигналами из других клеток. Много таких тонкостей в протоколе, поэтому мы вынуждены почти все делать своей группой. Мы сейчас собрали фактически все когорты, которые хотели, и сделали секвенирование и генотипирование примерно половины образцов. Начинаем анализировать и видим, что данные получились хорошие, и уже появляются новые интересные гипотезы.
Недавно вышел пакет работ американского консорциума All of Us, это чистая генетика, и у них цель — сделать миллион образцов. Они сделали уже четверть и до некоторой степени смогли сбалансировать по этносу, по каким-то заболеваниям, собрать именно тех, кого интересно собрать. Это очень большое дело, и впечатляет, что удалось уговорить инвесторов в это вкладываться, потому что это фундаментальные исследования. Завтра на этом у вас не будет «таблетки от всего».
А без этого вообще ничего не получается, когда каждый делает маленькое исследование интересного для него заболевания, а сравнить результаты толком не с чем. Вы не знаете, как это в норме происходит, а уже хотите смотреть, как это происходит при заболевании. Всегда получается, что берут мало здоровых людей, потому что интереснее больные, а из-за такой постановки результаты часто не воспроизводятся. Вариантов нормы очень много. Это и этнические различия, и различия в диете, образе жизни, много еще чего. Здоровые люди разные, и когда в качестве здоровых контролей берется одна небольшая группа, всегда есть шанс, что те различия, которые нашли с больными, — случайность и какой-то неучтенный параметр, который не имеет отношения к заболеванию. В этом смысле глобальные инициативы — это очень важно, они очерчивают границы нормы. Сейчас во многих странах стали появляться такие проекты.
Коллаборация — это очень большое дело, и то, что сейчас это стало сложнее — большой удар для нашей науки. Из моих коллабораторов официально мало кто отказался работать, но все вынуждены как-то выкручиваться, потому что есть некие запреты, которые приходится обходить. И до сих пор непонятно, насколько эффективно это получится в результате.
В науке должны быть длинные проекты, фундаментальные, и короткие, более прикладные. Любой перекос — это неправильно. «Долгого» финансирования почти нигде нет. Это проблема, потому что все, по крайней мере, в биологии, вынуждены делать фундаментальные вещи «из-под ковра», как-то притягивать практическую пользу. Есть организации, которые считают, что ученые должны работать по правилам организации, а не организация должна помогать ученым решить их задачи. Вот это неудобно. Но, мне кажется, это бесконечный спор — как все должно быть правильно. Для многих ученых полезно, когда их вынуждают думать не только о высоком, но и какие-то прикладные вопросы решать. Тут нужно найти баланс.
В России тяжело с реагентами. Всегда было тяжело, сейчас лучше не стало. Поэтому любой экспериментальный проект идет медленно. Кроме того, существует чрезмерная регуляция закупок реактивов и вычислительных мощностей. Любой группе ученых, даже маленькой, нужен человек, который будет все время заниматься оргвопросами и закупками. В институтском штатном расписании такой человек не предусмотрен, особенно в небольших лабораториях. Приходится искать дополнительные деньги, чтобы такого человека нанять, потому что иначе оргвопросы занимают нечеловеческое время у ученых.
Меня давно смущает, что у нас совсем нет рынка кадров. Видимо, это наследие старой научной школы. Люди заканчивают магистратуру или аспирантуру, и если им все нравится, остаются в лаборатории. Если же они решают лабораторию покинуть, то, скорее всего, уходят из академической науки во что-то прикладное либо уезжают за рубеж. У нас фактически нет срочных контрактов — чтобы человек работал постдоком два-три года и понимал, что за это время он точно что-то должен доделать, выпустить статью, разработать программу, иначе ему тяжело будет устроиться на работу. А потом квалифицированный человек выходил бы на рынок и его можно было бы нанимать. Сейчас в большинстве случаев мы берем студентов, учим их, а это долго. В европейских научных лабораториях контракты срочные, люди знают, что за два-три года нужно что-то сделать и идти дальше. Это немного стрессовая ситуация, хотя в большинстве организаций при определенных обстоятельствах срок можно растянуть еще на сколько-то. Но ощущение бесконечности процесса тоже не на пользу. С другой стороны, мои знакомые, которые в Европе работают уже не на уровне студентов-постдоков, а на уровне профессоров, жалуются на срочные контракты. Четыре-пять лет, только построил работающую группу, сделал несколько хороших проектов, и нужно искать другое место. Многие утомляются от этого.
Почему все у нас развивается не самым эффективным образом — мне кажется, тут несколько компонент. Во-первых, у нас почти нет научного менеджмента. Управляют наукой люди, раздающие деньги, люди из министерства, которые не очень понимают специфику научной работы. Или люди, которые вышли из академической среды. Но им обычно не нравится руководить, поэтому они не стараются научиться руководить правильно. Да и в целом нет идеи, что руководить научными проектами надо учиться. Другая проблема — кадры. Сложно найти людей среднего звена, выращивать их долго, они могут передумать в процессе. А сманивать сотрудников в России из других лабораторий, в общем, не принято. Известная проблема — медленные поставки. Исследования надо планировать, но иногда возникают вопросы, о которых не думали, когда писали заявку на грант. Хочется еще что-то не очень большое проверить, а надо было заказывать реактивы для этого два-три месяца назад.
Несколько лет назад я была в Университете Окинавы в гостях, у меня был проект с японцами, и я случайно оказалась на мероприятии защитившихся аспирантов. Там было много местных руководителей. С одним из членов попечительского совета мы начали общаться, он стал задавать вопросы про наши цели и планы на пять-десять лет. И я поняла, что после нескольких лет работы в России не только не планирую на десять лет, а с некоторым трудом планирую на год-полтора. Запланировать-то можно, а толку? Все так быстро меняется.
Хотелось бы организовать большую платформу, которая позволяла бы интегрировать разные данные секвенирования, генотипирования и другие. Сейчас у нас все делают что-то свое, и совместный анализ этих данных затруднителен. Сделать большой проект одной группой — сложно и дорого. Интеграция, открытость первичных данных дает возможность делать гораздо более интересные модели, более достоверные гипотезы. Понятно, что с некоторыми данными, например, генетическими, мы ограничены законами разных стран о персональной информации. В России до сих пор именно генетическая информация находится в «серой» правовой зоне. В явном виде обмен генетическими данными в России не запрещен, но многие организации считают, что это не та информация, которой можно делиться. Создание платформы, которая позволяла бы интегрировать разные данные, при этом не нарушая закон о персональной информации, могло бы оказаться большим прорывом. Мне кажется, было бы полезным придумать, как, не нарушая законности, позволять людям работать со всем массивом данных.
Кроме того, важно генерировать данные так, чтобы они были сравнимы. Данные все сделаны по-разному, в разных протоколах, с разными задачами. Их очень тяжело интегрировать. Единственный шанс получить что-то внятное — анализировать с самого начала, с того, что из машины выходит. Но и тут не всегда хорошо получается. Есть The Human Phenotype Project, не российский, где пытаются разработать, как вообще стандартизировать метаданные. У вас есть человек, есть его генотип. Но когда вы будете работать с массовыми данными, вам может быть интересен конкретный вопрос, а у вас нет данных по человеку, кроме того, что он, скажем, болен диабетом II типа. А чем его лечат, когда был поставлен диагноз, какие еще заболевания у него есть, какие особенности? Прежде чем начать работать с публичными данными, надо потратить много времени на предобработку, чтобы вообще можно было работать. И в процессе у многих ученых теряется задор, потому что это не гарантия, что все получится. Как у биоинформатика, у меня нет ощущения, что данные уже есть, бери и делай, что хочешь. Они есть, но в таком виде…
Мы пытались обсуждать, как решать вопрос с тем, чтобы делиться генетическими данными. Пока хорошо не придумали. Наш эволюционный проект по single-cell — это изначально часть международного проекта Asian Immune Diversity Atlas (AIDA).. Они делают это для здоровых людей разных этносов, с фокусом на азиатские группы. Изначально, до 2022 года, была идея, что мы просто соберем свои данные, а дальше они будут обрабатываться в рамках одного программного конвейера в Сингапуре. Потом стало ясно, что так не получится. Решили, что будем делать те же протоколы и некую визуальную картинку проекта, на которой будем показывать какие-то результаты анализа, а не исходные данные. Плюс сделаем возможность запроса доступа к данным для внешних людей, и этический комитет будет давать согласие или несогласие на это. Но это не оптимальное решение, оно медленное.
Я большие надежды возлагаю на образование. Хотелось бы, чтобы в обществе рассосались всякие мысли про вред ГМО и всего прочего. Надеюсь, через 50 лет это будет возможно. Когда на все подряд ставят бирочки «без ГМО» для повышения продаж — это же деньги, которые можно потратить на что-то другое.
По применению новых знаний в будущем нет ощущения, что вот сейчас будет глобальная перестройка. Есть ощущение поступательного развития. Если говорить про эпигенетику, то эпигенетические лекарства и сейчас используются, наверняка будут использоваться шире. И наверняка будет более целевое использование, когда лекарство привлекается в конкретные клетки и может быть, в конкретные места геномов, которые надо регулировать.
Биоинформатика поменяется, потому что она привязана к технологиям, а они меняются очень быстро. То, как мы сейчас работаем с данными секвенирования, — пока это условная Illumina, второе поколение секвенирования — это одни методы. Появился нанопор — это другие методы. Технологии получения данных определяют базовые биоинформатические алгоритмы. Что касается более интегрального анализа данных, тут, мне кажется, большую роль будут играть глубокое обучение, искусственный интеллект и т.д. С теми же данными single cell стандартной статистикой работать тяжело. Это «зашумленные» данные, с ними, когда их много и они прошли хорошую и стандартизированную изначальную предобработку, интересно работать методом машинного обучения. Сейчас есть красивые примеры применения, но все упирается в то, что тяжело интегрировать данные из разных источников. Сейчас, мне кажется, в эту сторону надо работать. И тогда «взорвется» эта область машинного обучения, будет много открытий. Просто потому, что интуиции отдельных людей уже не хватает, слишком большой объем информации.
В идеальном мире люди тратят заметное время на свое самообразование, постепенно осознают, что их собственное здоровье — это зона ответственности самого человека, а не врачей, перестают говорить бездоказательные глупости, критически осмысляют поступающую информацию и перестают заниматься странными вещами вроде междоусобных конфликтов. А в науке развивается глобальная коллаборация, ученые и управленцы в науке перестают бояться собственных теней и начинают понимать, что данные — это общечеловеческое достояние, и от того, что вы свои полпроцента данных скрыли ото всех, не будет лучше никому.
Людям не хочется про себя узнать базовые вещи, им хочется узнать, что они родственники какого-то царя. Это гораздо лучше продается. Людям интересны яркие события, а то, как на самом деле все работает, интересно меньше. В рамках проекта про диабет мы много общались с врачами и пациентами. Очень тяжело объяснить, что это то самое заболевание, когда образ жизни вносит, возможно, 90% эффекта, а роль таблеток существенно меньше.
Медицинская наука воспринимается значительным числом населения как магия, добрая или злая. Один из наших потенциальных доноров рассказывал, что не будет сдавать кровь на генетический анализ. Ему ответили, что у нас все добровольно, не хочет — пусть не сдает. И он пытался объяснять, как нам не рассказывают, что уже разработано генетическое оружие и будут стрелять в людей по их ДНК. Я попыталась выяснить, как до этого удавалось убить так много людей и как обходились без ДНК, но уже не было развития мысли. Такое магическое мышление по отношению к науке сильно подрывает применение исследований на практике.
Предсказывать — неблагодарное занятие. Но мне кажется, что в отраслях что-то будет происходить. Интеграция биологических данных с новыми методами работы, с глубоким обучением, скорее всего, породит много интересных идей, даже прорывных, особенно в прикладном смысле.
Молодому поколению я бы посоветовала не бояться менять свою жизнь. Если вы вдруг понимаете, что то, что вы сделали, неправильно, что направление, которое вы выбрали, не очень вам подходит, тут можно только посоветовать не бояться. Никогда не поздно продолжать искать. Людям науки вообще свойственен перманентный поиск, но это надо делать и в своей жизни тоже. И не отчаиваться раньше времени. Если хочется заниматься наукой, надо понимать, что бо́льшая часть проектов провальная. Так природа устроена. И хорошо бы на ранней стадии понимать про себя, готов ли ты к этому, потому что есть масса интересных интеллектуальных занятий, которые не подразумевают такого количества перманентных катастроф разного масштаба. Но интересно же понимать, как мир устроен. А если интересно, то надо этим заниматься. Эмоциональное выгорание, типичное для людей среднего возраста, у людей науки случается реже. Просто за счет того, что происходит много интересного и мозг не застаивается.
Я бы посоветовала молодежи строить систему научных контактов, такой network. Это новые идеи, это какие-то неочевидные знания — где какие конференции происходят. Это поиск работы, это хорошие компании. С людьми науки интересно не только наукой заниматься.
И еще порекомендовала бы ставить себе цель на какой-то срок. Даже тем, кто делает PhD, три-четыре года, вроде бы фиксированный срок, — ставить задачи: к какому сроку вы хотите, чтобы что-то было сделано. Даже если вы не уложитесь в этот срок, вы гораздо сильнее приблизитесь к цели, чем если будете «просто делать». Иначе есть шанс погрязнуть в рутинной работе и потерять горизонт.
Беседовала Анастасия Полтавец