Геном злокачественной опухоли: взгляд в глубину

В журналах Nature представлены результаты проекта «Полногеномный анализ злокачественных опухолей» (Pan-Cancer Analysis of Whole Genomes, PCAWG). В проекте участвуют более 1300 ученых и медиков из 37 стран; в ходе его работы был проведен анализ более 2600 геномов 38 типов злокачественных новообразований. Проект делает доступными не только данные по секвенированию геномов, но и программное обеспечение для их анализа.

Изображение:

Эстер Рейнбау (справа) и Гэд Гетц (слева), первый и со-ведущий авторы работы об онкогенных драйверах в некодирующих участках. Credit: Bearwalk Cinema | Пресс-релиз Института Брода

Подведение итогов очередного этапа проекта PCAWG приурочено ко Всемирному дню борьбы против рака (4 февраля). «Это исследование дает нам наиболее точное на сегодняшний день представление о мутациях во всех участках генома, вызывающих злокачественные опухоли», — говорит профессор биомолекулярной инженерии Джош Стюарт.

Участники проекта заявляют, в частности, что исследователи приближаются к каталогизации всех биологических путей, связанных с раком; «по крайней мере, одна причинная мутация была обнаружена практически во всех проанализированных раковых образованиях»; среди важных направлений дальнейшего развития обозначает раннюю идентификацию онкогенных мутаций и классификацию опухолей в соответствии с паттернами генетических изменений, для более направленного лечения.

«Эти исследования помогают ответить на давний медицинский вопрос: почему результат лечения одним и тем же лекарством двух пациентов с одним и тем же видом злокачественной опухоли может быть различен. Мы показываем, что причина в ДНК. Геном каждого пациента уникален, но в геномах есть и определенные паттерны, которые мы можем обнаружить в масштабных исследованиях большого количества данных, и использовать для оптимизации диагностики и лечения», — сказал доктор Питер Кэмпбелл из Велком Сэнгер Института в Великобритании.

Результаты PCAWG представлены в 23 публикациях в Nature от 5 февраля 2020 года и аффилиированных с Nature журналах (комментарий авторов проекта). Здесь мы обсуждаем некоторые из этих публикаций.

Длинные некодирующие РНК

Длинные некодирующие РНК (long non-coding RNA, lncRNA) — это РНК длиной около 200 пар нуклеотидов, не кодирующие белок и способные образовывать комплексы с белками и PНК. У них множество функций, включая регуляцию транскрипции и процессинг мРНК. Известно, что некоторые из них вовлечены в развитие злокачественных опухолей. LncRNA могут быть онкогенами (например, lncRNA MALAT1) или супрессорами злокачественной опухоли (lncRNA-p21), их уровень в опухоли по сравнению с нормальной тканью может быть как повышен, так и понижен. Tакже в lncRNA, экспрессирующихся в опухолевой ткани, могут присутствовать мутации, которых нет в нормальной ткани. Однако около 99% lncRNA, известных на данный момент, не охарактеризованы.  

Проект PCAWG объединяет данные полногеномного секвенирования из двух проектов, Международного консорциума генома злокачественных опухолей (International Cancer Genome Consortium, ICGC) и Атласа генома злокачественных опухолей (The Cancer Genome Atlas, TCGA). В рамках консорциума PCAWG был создан каталог lncRNA, связанных с развитием рака (Cancer LncRNA Census, CLC).  Нa данный момент он содержит 122 lncRNA. Включенные в CLC lncRNA были выбраны в ходе анализа литературы, критериями включения служили экспериментальные in vivo или in vitro доказательства связи lncRNA с развитием злокачественной опухоли. В этот список включены только те lncRNA, которые имели идентификаторы GENCODE (причем 8 из 122 lncRNA, вошедших в CLC, были аннотирoваны GENCODE  как псевдогены). Среди них было несколько  lncRNA связанных более чем с 16 типами злокачественных новообразований (lncRNA HOTAIR, MALAT1, MEG3 и H19).

Из 122 lncRNA, вошедших в CLC, 77 (63,1%) — онкогены, 35 (28,7%) — супрессоры опухоли, а 10 (8,2%) могут быть онкогенами либо онкосупрессорами в зависимости от типа опухоли. Авторы публикации обнаружили 10 мутаций, вызывающих развитие злокачественной опухоли, в восьми lncRNA (например, LINC-PINT и NEAT1). Также они показали, что у генов lncRNA, включенных в CLC, сайт старта транскрипции, как правило, расположен в пределах 100 т.п.н. от однонуклеотидного полиморфизма зародышевой линии, связанного с развитием рака. Кроме того, lncRNA из CLC обычно располагаются ближе к генам, связанным с развитием злокачественных опухолей, нежели lncRNA, не входящие в CLC, причем в большинстве случаев они находятся в непосредственной близости от начала гена. Наконец, наблюдается корреляция уровня экспрессии lncRNA и гена, перед которым она расположена (возможно, за счет образования петель хроматина). Для восьми lncRNA человека были найдены ортологи в геноме мыши, также связанные с развитием злокачественных новообразований.

Это первая версия каталога CLC, который будет развиваться и пополняться.

Joana Carlevaro-Fita, et al. // Cancer LncRNA Census reveals evidence for deep functional conservation of long noncoding RNAs in tumorigenesis. // Communications Biology, 2020; DOI: 10.1038/s42003-019-0741-7

Топология хроматина

Хроматин упаковывается в виде петель, формируя так называемые топологически ассоциированные домены ДНК (topologically associating domains, TAD), причем гены, расположенные внутри таких доменов, имеют схожие эпигенетические маркеры и профили экспрессии. Нарушение структуры и границ TAD, что зачастую происходит в клетках злокачественных опухолей, ведет к изменению экспрессии находящихся в нем генов, эпигенетических модификаций ДНК и гистонов.

В рамках консорциума PCAWG исследователи провели анализ 288 457 соматических структурных вариантов, их распределения и влияния на TAD. Они определили границы TAD пяти клеточных линий человека, мезодермального, эндодермального и эктодермального проиcxождения. Был охарактеризован также набор из 2 477 границ TAD, общий для всех трех типов тканей, его и использовали в дальнейшем исследовании.

Оказалось, что в геномах злокачественных опухолей разные типы соматических вариантов влияют на границы TAD, причем изменения структуры хроматина тканеспецифичны. Например, границы в районе локуса, в котором расположен ген MDM2, более всего были затронyты в тканях лейомиосаркомы. Затем авторы изучили сайты связывания трaнскрипционного фактора CTCF, который также участвует в образовании петель ДНК, и выяснили, что при многих видах злокачественных опухолей эта его функция нарушена. Например, сайт связывания CTCF, расположенный рядом с геном FOXC1, оказывается утерян в результате делеции, характерной для аденокарцином кишечника.

Обнаружилось также, что структурные варианты могут приводить к объединению TAD. Любопытно, что только в 14% случаев, при которых исчезали границы между разными TAD, экспрессия близлежащих генов изменялась более чем в 2 раза. Если при утрате границы TAD происходило слияние репрессированного домена и активного домена, гены в репрессированом домене активировались. Кроме того, структурные варианты могут приводить к формированию новых TAD.

Как и следовало ожидать, сложные хромосомные перестройки в клетках опухоли значительно изменяли топологию хроматина и оказывали сильное влияние на «карту упаковки генома».

Лучше понять роль топологии хроматина в развитии злокачественных новообразований помогут дальнейшие исследования, в том числе с использованием данных полученных на нормальных неопухолевых тканях.

Kadir C. Akdemir, et al. // Disruption of chromatin folding domains by somatic genomic rearrangements in human cancer. // Nature Genetics, 2020; DOI:  10.1038/s41588-019-0564-y

Теломеры

Теломеры — это нуклеопротеиновые комплексы на концах хромосом, которые укорачиваются при каждом клеточном делении. Поддержание длины теломер, необходимое клеткам опухоли для постоянной пролиферации, достигается или за счет активации обратной транскриптазы теломеразы (telomerase reverse transcriptase, TERT), или за счет альтернативных механизмов, через рекомбинацию ДНК теломер (alternative lengthening of telomere, ALT). Альтернативный путь связан с утратой или нарушением функций белков ATRX или DAXX. Для клеток, в которых удлинение теломер происходит за счет ALT-пути, также характерно присутствие так называемых внехромосомных теломерных Ц-колец (C-circles) и геномная нестабильность. В них также повышена экспрессия длинной некодирующей содержащей теломерный повтор РНК (long noncoding telomeric repeat-containing RNA, TERRA).

Авторы этой работы в рамках консорциума PCAWG изучили генетический след этих двух механизмов удлинения теломер. В 25% образцов фрагменты теломер интегрировались в другие участки генома. Доля таких соматических вставок достигала 80% в опухолях с мутациями в генах ATRX и DAXX. Авторы обнаружили соматические мутации в ATRX, DAXX или TERT в 16% образцов.

ДНК теломер состоит из разных повторяющихся нуклеотидных вариантов (telomere variant repeats, TVR). Чаще всего встречаются гексамеры TTAGGG (t-тип), TGAGGG (g-тип), TCAGGG (c-тип), и TTGGGG (j-тип). Авторы обнаружили, что TGAGGG и TTCGGG встречаются чаще, а TTTGGG, наоборот, намного реже, в клетках с мутациями в ATRX или DAXX, по сравнению с клетками, где удлинение теломер осуществляет TERT.

Удлинение теломер через ALT механизм происходит с наибольшей вероятностью при лейомиосаркоме, остеосаркоме, и эндокринных опухолях поджелудочной железы.

Lina Sieverling, et al. // Genomic footprints of activated telomere maintenance mechanisms in cancer. // Nature Communications, 2020; DOI: 10.1038/s41467-019-13824-9

Butler

Авторы разработали и проверили на данных консорциума PCAWG вычислительный инструмент Butler для геномного анализа на облаке. Butler можно применять для анализа данных GTEx ( http://gtexportal.org), ENCODE (http://encodeproject.org), Human Cell Atlas Project ( http://humancellatlas.org). Эффективность Butler на 43% выше, чем у других используемых в настоящее время инструментах геномного анализа.

Sergei Yakneen, et al. // Butler enables rapid cloud-based analysis of thousands of human genomes. // Nature Biotechnology, 2020; DOI:10.1038/s41587-019-0360-3

DriverPower

Основная цель проектов по секвенированию ДНК из злокачественных опухолей — это обнаружение драйверных мутаций, взывающих развитие новообразования. В этой работе авторы описывают DriverPower, пакет програмного обеспечения, которое оценивает опухолевую мутационную нагрузку и функциональный импакт для обнаружения драйверных мутаций в кодирующих и некодирующих участках генома. При тестировании на коллекции из 2583 опухолевых геномов консорциума PCAWG DriverPower обнаружил 217 драйверных мутаций в кодирующем и 95 в некодирующих участках. При сравнении с шестью ранее опубликованными методами DriverPower оказался наиболее точным.

Shimin Shuai, et al. // Combined burden and functional impact tests for cancer driver discovery using DriverPower. // Nature Communications, 2020; DOI:  10.1038/s41467-019-13929-1

Мутационные сигнатуры

Авторы этой работы охарактеризовали мутационные сигнатуры 84 729 690 соматических мутаций в 4 645 полногеномных сиквенсах и 19 184 сиквенсах экзома злокачественных опухолей человека.

Ludmil Alexandrov, et al. // The Repertoire of Mutational Signatures in Human Cancer. // Nature, 2020; DOI:  10.1038/s41586-020-1943-3

Драйверные мутации в некодирующих последовательностях

Как правило, драйверные мутации вызывающие развитие опухоли, ищут в генах, кодирующих белки. Авторы данной работы провели анализ точечных драйверных мутаций и структурных вариантов ДНК в некодирующих регионах 2658 геномов из PCAWG.

Этот анализ подтвердил ряд ранее полученных данных, а также обнаружил новые кaндидатные мутации, напримеp точечную мутацию в 5′-регионе гена TP53 и в 3′-нетранслируемом регионе генов NFKBIZ (характерны для лимфом) или TOB1 (характерна, например, для карцином). Мутации, ассоциированные с повышенным уровнем экспрессии, часто обнаруживались в промоторном участке гена TERT. В то же время мутации в 5′-нетранслируемом регионе MTG2 (кодирует ГТФазу, вовлеченную в функционирование митохондриальной рибосомы) снижали экспрессию гена. В четырех меланомах была обнаружена хромосомная перестройка, приводящая к слиянию промоторного участка гена TERT и участка гена BASP1 (оба расположены на пятой хромосоме).

Помимо этого, авторы нашли несколько структурных вариантов, влияющих на экспрессию ряда генов при определенных видах опухолей, например, структурные варианты в участке 10p15, ассоциированные с двукратным возрастанием экспрессии генов AKR1C1, AKR1C2 и AKR1C3 в некоторых случаях гепатокарциномы. Также были обнаружены часто встречающиеся микроделеции (<50 т.п.н.) в 5′-регионе гена BRD4 при раке яичников и молочной железы.

Esther Rheinbay, et al. // Analyses of non-coding somatic drivers in 2,658 cancer whole genome. // Nature, 2020; DOI:  10.1038/s41586-020-1965-x


Добавить в избранное