Третья фаза ENCODE обнаружила тысячи новых взаимодействий внутри генома

Проект ENCODE (Encyclopedia of DNA Elements), цель которого — исследование регуляции генома млекопитающих, завершил третью фазу. Описано почти 6000 новых наборов данных по регуляторным элементам в геномах множества типов клеток человека и мыши. Исследованы ДНК-белковые взаимодействия, расположение транскрипционных факторов, структура и модификации ДНК, связанные с активностью генов, а также РНК-белковые взаимодействия.

Изображение:

РНК-связывающие белки (зеленые) в гепатоцитах карциномы. Ядра клеток помечены синим, актин помечены красным

Credit:

Éric Lécuyer | Пресс-релиз MIT

Опубликованы результаты очередного этапа проекта ENCODE — исследования участков геномной ДНК, не кодирующих белки. Такие участки составляют около 98% генома человека, и их давно уже не считают «мусорной ДНК», а признают необходимыми для регулирования активности генов. Проект ENCODE (Encyclopedia of DNA Elements), осуществляемый силами международного консорциума, исследует роль регуляторных элементов в некодирующей части генома, благодаря которым в разных клетках экспрессируются те или иные гены. Регуляция генной активности формирует разные типы клеток — потомков одной зародышевой клетки, она лежит в основе индивидуального развития организма и его взаимодействия с окружающей средой. Объекты исследования — геномы человека и мыши.

Проект стартовал в 2003 году. Первая пилотная фаза проекта исследовала 1% генома человека, вторая фаза охватила весь геном на нескольких типах клеток. Сейчас в журналах Nature около десятка статей представляют результаты, полученные в фазе III проекта ENCODE. Задачами этой фазы были детальный анализ транскрипции РНК в разных клетках и тканях (не только в клеточных линиях in vitro, но и в образцах, взятых непосредственно из организма), анализ структуры и модификаций хроматина, метилирования ДНК, расположения транскрипционных факторов и РНК-связывающих белков. Задачей третьей фазы, начатой в 2012 году, стало исследование самого широкого спектра клеток и тканей человека и мыши – 503 клеточных типа, полученных из 1369 источников биологических образцов. Проект суммировал результаты около 6000 новых экспериментов (4834 проведены на клетках человека и 1158 — на клетках мыши).

Как отмечается в головной публикации, в ходе фазы III участники консорциума:

— определили ключевые наборы генов для основных клеточных типов, используя новые карты РНК транскриптов;

— описали расположение ДНК-элементов, кодирующих сайты распознавания для РНК-связывающих белков;

— составили детальную карту расположения транскрипционных факторов в геноме человека, в референсных типах клеток, и связали их с ключевыми свойствами промоторов и энхансеров;

— существенно расширили список клеток и тканей, в которых изучены сайты гиперчувствительности к ДНКазе I (то есть деконденсированные, транскрипционно активные участки ДНК) и сайты связывания факторов транскрипции;

— охарактеризовали 3D структуру хроматина (хромосомные петли, которые могут сближать регуляторные элементы) и взаимодействия между его участками в клетках 24 типов;

— продолжили описание модификаций хроматина, доступности ДНК, метилирования ДНК и ландшафта РНК транскрипции в геноме мыши на ранних стадиях развития, которые нельзя изучать на человеке.

Для анализа взаимодействий регуляторных белков с ДНК проект использует технологию ChIP-seq – метод, основанный на иммунопреципитации хроматина и высокопроизводительном секвенировании. С его помощью составлены регистры цис-регуляторных элементов (то есть находящихся на одной хромосоме с регулируемым участком генома), к ним относятся энхансеры и промоторы. В регистры вошли 926 535 цис-регуляторных элементов человека и 339 815 — мыши. Составлена карта расположения 662 ассоциированных с хроматином белков в референсных клеточных типах.

Одна из важных задач очередной фазы ENCODE — изучение РНК-связывающих белков (РСБ). Гены, кодирующие РСБ, в геноме человека составляют около 10% всех генов, кодирующих белки. Поскольку они не являются некодирующими генами, ранее они не попадали в зону внимания ENCODE. Между тем посттранскрипционная регуляция (на уровне РНК) не менее важна, чем на уровне ДНК. Одни РНК-связывающие белки участвуют в сплайсинге РНК, другие обозначают окончание транскрипции, третьи облегчают процесс трансляции, четвертые разрушают РНК после трансляции или управляют ее транспортировкой. Все это так или иначе влияет на экспрессию генов.

«Технологии для исследования РНК-связывающих белков теперь приближаются к уровню, на котором мы можем исследовать ДНК-связывающие белки, и мы надеемся, что знания о функциях РНК станут гораздо более полными», — говорит Кристофер Бердж, профессор Массачусетского технологического института, один из участников проекта.

Например, для этой цели использовалась технология eCLIP, как и ChIP-seq, основанная на иммунопреципитации: белок, сидящий на молекуле РНК, сшивается с ней ультрафиолетом, а затем РНК-связывающие белки изолируются при помощью антител. С ее помощью определили участки связывания 150 РСБ в клетках двух линий, K562 и HepG2. Эти данные объединили с результатами другой серии экспериментов, в которых подавляли экспрессию около 260 РСБ в клетках человека: проверили влияние нокдауна каждого из белков на РНК, с которыми они взаимодействуют.

Используя технологию RNA Bind-N-Seq, разрабатываемую в лаборатории Барджа, исследователи смогли более точно определить участки связывания белков с РНК — очень короткие последовательности, которые часто содержат петли или шпильки.

В общей сложности ученые исследовали около 350 РСБ человека из 1500 известных. Действие факторов сплайсинга РНК может зависеть от того, где они связываются с транскриптом, например, когда они садятся на одном конце интрона, сплайсинг активируется, когда на другом — подавляется. Возможно, создание подробных карт связывания РСБ поможет понять, почему так происходит, говорит Бердж.

Другая группа под руководством Эрика Лекьюра из Монреальского университета пометила более 300 РНК-связывающих белков зеленым флуоресцентным белком (GFP), чтобы выяснить их локализацию в клетке — в ядре, цитоплазме или митохондриях.

Интересно, что некоторые РНК-связывающие белки взаимодействуют также с ДНК. Однако пока неясно, прямое ли это взаимодействие или оно опосредовано другими белками или РНК, связанными с хроматином.

Для облегчения доступа к созданным регистрам по человеку и мыши и использования их для решения разных биологических и биомедицинских проблем в рамках проекта создан специальный веб-интерфейс SCREEN. Все данные и протоколы экспериментов, а также программное обеспечение доступны онлайн.

Источники

The ENCODE Project Consortium et al. // Expanded encyclopaedias of DNA elements in the human and mouse genomes // Nature, 2020, 583, pages 699–710; DOI: 10.1038/s41586-020-2493-4

Цитаты по пресс-релизу

Добавить в избранное

Вам будет интересно