Алгоритм, предсказывающий взаимодействия генов, может быть полезен для лечения рака
Информация о парах генов, оба члена которой необходимы для клеточной жизнедеятельности, позволит подобрать эффективную индивидуальную терапию онкологических заболеваний. Например, если мутацией поврежден один из двух таких генов, мишенью терапии должен быть другой.
Применяемые методы лечения рака, как правило, обладают неселективным действием, и потому вызывают сильнейшие нежелательные реакции организма. С другой стороны, известно, что в раковых клетках инактивированы определенные гены, что приводит к нарушению нормального клеточного цикла, но не к смерти клетки. А что если использовать эту особенность опухолевых клеток для их же устранения?
С 1997 года ведется изучение синтетически летальных генов. Так называются пары генов, если дисфункция обоих сразу (но не одного из двух по отдельности) приводит к клеточной смерти. Если в опухолевых клетках зафиксировано отсутствие экспрессии гена, состоящего в синтетически летальной паре, удобно разработать индивидуальную терапию, которая обезвредит клетки опухоли, не причинив вреда здоровым клеткам.
Этот способ уже активно применяется в практике. К примеру, олапариб, ингибитор белка PARP, оказался успешен в лечении пациентов с мутациями в генах BRCA1 и BRCA2. Поли(АДФ-рибоза)-полимераза PARP1— ключевой фермент в пути репарации однонитевых разрывов ДНК, в то время как белки BRCA1и BRCA2 важны при репарации двунитевых разрывов ДНК. Потому при мутации и нарушении функций одного из белков BRCA клетка становится крайне зависимой от активности PARP1.
Многие другие синтетически летальные пары уже найдены, но миллионы потенциально полезных пар остаются неизвестными. Их экспериментальные поиски отнимают много времени и ресурсов, а алгоритмы, предсказывающие такие пары на основе вычислений, до сих пор часто выдавали ошибочные результаты. Потому группа биоинформатиков из университета Сассекса разработала классификатор SLant (Synthetic Lethal analysis via Network topology), значительно опередивший по качеству вычислительных предсказаний существующие аналоги.
На основе базы данных STRING исследователи создали карты белок-белковых взаимодействий для 5 видов: человека, дрожжей Saccharomyces cerevisiae и Schizosaccharomyces pombe, плодовой мушки Drosophila melanogaster, нематоды Caenorhabditis elegans. Карты представляют собой графы, где белки обозначены вершинами, а взаимодействия между ними — ребрами. Далее, используя пакет R igraph, из этих карт извлекли параметры графа. С помощью геномного браузера Ensembl каждому белку приписали соответствующий ген, а затем получили из данных проекта Gene Ontology параметры, характеризующие функции и биологические процессы, в которые вовлечены эти гены. Далее осталось только найти среди всех существующих взаимодействий генов синтетически летальные пары, для чего обратились к базе данных BioGRID и отметили негативные взаимодействия генов как искомые.
В качестве тренировочной выборки для последующего машинного обучения взяли равные количества синтетически летальных пар и контрольных пар генов от каждого вида независимо. При этом были использованы данные лишь для двух видов — H. sapiens и S. cerevisiae, так как данных для других организмов не было достаточно для предсказательных целей.
В результате анализа тренировочной выборки выяснилось, что гены в синтетически летальных парах, как правило, гораздо реже участвуют в одном и том же биологическом процессе, чем гены в контрольных взаимодействиях. Однако функции их чаще оказываются схожи, и они чаще локализованы в одних и тех же клеточных компартментах, чем контрольные пары. Получается, синтетически летальные пары обычно принадлежат очень схожим, но не зависимым друг от друга путям. Такую закономерность можно понять — ведь нарушение двух функционально схожих метаболических путей гораздо губительнее для клетки, чем нарушение двух элементов в одном из таких путей.
В итоге обучения исследователи получили классификатор на основе случайного леса. Лучший из полученных классификаторов для отдельного организма проверили на предсказательную способность. Оказалось, что новый классификатор SLant (Synthetic Lethal analysis via Network topology) имеет значение ROC AUC 0,965 при поиске синтетически летальных пар для H. sapiens. Чем ближе ROC AUC к единице, тем лучше. Между тем показатель ROC AUC его предшественника, алгоритма DAISY, составляет лишь 0,779.
SLant был также обучен предсказывать другой перспективный в терапии тип взаимодействия — синтетически дозозависимые летальные пары, или пары, летальные для клетки при повышенной экспрессии одного гена и отсутствии экспрессии другого.
Чтобы открыть доступ к найденным взаимодействиям для широкой публики (для медработников в первую очередь), группа создала базу данных Slorth. Туда попали наиболее качественные предсказания, а именно взаимодействия, имеющие коэффициент не ниже 0.75 относительно межвидового консенсуса.
Три из найденных синтетически летальных пар были проверены in vitro. Для этого использовали линию клеток остеосаркомы человека с мутантным геном PBRM1, кодирующим белок BAF180. Этот белок в норме является супрессором опухоли и играет роль в упаковке хроматина и транскрипции ДНК. Мутантные клетки оказались гораздо чувствительнее к ингибиторам PARP и ABL1, чем клетки контроля, потому можно заключить, что гены PBRM1 и PARP1/ABL1 – достоверные синтетически летальные пары. Интересно, что все эти гены так или иначе участвуют в пролиферации и регуляции ответа на повреждение ДНК. При обработке же ингибитором POLA1, белка-участника репликации ДНК, смертность среди контрольных клеток была значительно выше, чем в мутантных, и исследователи полагают, что это пример другого типа взаимодействия генов – синтетического спасения.
Источник
Frances M G Pearl, et al. // Predicting synthetic lethal interactions using conserved patterns in protein interaction networks // PLOS Computational Biology, 2019, DOI: 10.1371/journal.pcbi.1006888