Не только AlphaFold: компания DeepMind разработала ИИ для предсказания роли некодирующих вариантов в геноме
Последовательность генома человека собрана практически целиком, однако интерпретация вариантов в нем остается важной задачей. Особую трудность представляет «темная материя» генома — некодирующие участки, которые занимают основную его часть. Компания DeepMind, известная созданием AlphaFold для предсказания структуры белка по его аминокислотной последовательности, занялась этим направлением и представила модель ИИ для прогнозирования молекулярных фенотипов по последовательности ДНК. Алгоритм получил название AlphaGenome, он способен предсказывать данные в 11 модальностях (категориях), таких как экспрессия генов или работа сайтов сплайсинга, по информации о геноме.
Интерпретация генетических вариантов и их влияния остается одной из главных задач биологии. Особенно сложны для интерпретации варианты в некодирующих участках — то есть около 98% генома человека. Они могут косвенно влиять на активность белков в клетке, изменяя такие свойства хроматина, как его пространственная конфигурация и доступность.
Аналогичная задача — предсказание того, как последовательность влияет на трехмерную структуру — уже в значительной мере решена для белков. Ярким примером служит модель искусственного интеллекта (ИИ) AlphaFold, разработанная компанией DeepMind. Однако в случае ДНК единый ответ на вопрос о связи последовательности и пространственной структуры дать невозможно. Теперь создатели AlphaFold представили ИИ для предсказания того, каким влиянием будет обладать тот или иной вариант в некодирующей области. Разработка получила название AlphaGenome.
AlphaGenome — это модель глубокого обучения, прогнозирующая, как последовательность ДНК повлияет на молекулярные фенотипы. Она принимает в качестве входных данных одну мегабазу ДНК и с разрешением до одной пары оснований предсказывает так называемые геномные треки, то есть связывает каждую пару оснований с результатами тех или иных экспериментальных данных. Модель обучена на геномах человека и мыши, а среди молекулярных фенотипов анализирует экспрессию генов, инициацию транскрипции и связывание транскрипционных факторов, модификации гистонов, карты хроматиновых контактов и доступность хроматина, координаты сайтов сплайсинга и их использование, сплайс-переходы — всего 11 категорий (модальностей).
Для демонстрации возможностей AlphaGenome авторы попробовали оценить эффекты клинически значимых вариантов в некодирующих участках вблизи онкогена TAL1. Производительность сравнивали с другими современными ИИ, специализированными для работы с конкретной модальностью (например, Orca для картирования контактов в геноме).
AlphaGenome достигла наилучших результатов в 22 из 24 задач предсказания геномных треков и 24 из 26 задач предсказания эффектов вариантов. После обучения AlphaGenome могла одновременно предсказывать 5 930 геномных треков для человека и 1 128 — для мыши.
Однако разработчикам еще предстоит решить ряд задач, чтобы улучшить созданную модель. Они уточняют, что AlphaGenome была обучена только на данных человека и мыши. Возможно, она будет работать и на других организмах, но исследователи этого не проверяли. Кроме того, доработки требует точность некоторых предсказаний — модель с трудом определяет влияние последовательности на экспрессию гена, если их разделяет расстояние более 100 тысяч пар оснований. «Эта модель еще не решила задачу регуляции генов в той же степени, в какой AlphaFold справляется с предсказанием 3D-структуры белков», — поясняет Аншул Кундадже, специалист по вычислительной геномике из Стэнфордского университета в Пало-Альто (Калифорния), который получил ранний доступ к AlphaGenome.
В перспективе разработчики планируют выпустить более полную версию, способную работать с еще более широким спектром приложений. Пока же доступ к AlphaGenome для некоммерческих исследований возможен через программный интерфейс.
Источник
Žiga Avsec, et al. AlphaGenome: advancing regulatory variant effect prediction with a unified DNA sequence model (25 июня 2025, препринт)
Цитата: DeepMind’s new AlphaGenome AI tackles the ‘dark matter’ in our DNA // Nature News (2025). DOI:
10.1038/d41586-025-01998-w
Меню
Все темы
0





