Не только AlphaFold: компания DeepMind разработала ИИ для предсказания роли некодирующих вариантов в геноме

Последовательность генома человека собрана практически целиком, однако интерпретация вариантов в нем остается важной задачей. Особую трудность представляет «темная материя» генома — некодирующие участки, которые занимают основную его часть. Компания DeepMind, известная созданием AlphaFold для предсказания структуры белка по его аминокислотной последовательности, занялась этим направлением и представила модель ИИ для прогнозирования молекулярных фенотипов по последовательности ДНК. Алгоритм получил название AlphaGenome, он способен предсказывать данные в 11 модальностях (категориях), таких как экспрессия генов или работа сайтов сплайсинга, по информации о геноме.

Credit:
123rf.com

Интерпретация генетических вариантов и их влияния остается одной из главных задач биологии. Особенно сложны для интерпретации варианты в некодирующих участках — то есть около 98% генома человека. Они могут косвенно влиять на активность белков в клетке, изменяя такие свойства хроматина, как его пространственная конфигурация и доступность.

Аналогичная задача — предсказание того, как последовательность влияет на трехмерную структуру — уже в значительной мере решена для белков. Ярким примером служит модель искусственного интеллекта (ИИ) AlphaFold, разработанная компанией DeepMind. Однако в случае ДНК единый ответ на вопрос о связи последовательности и пространственной структуры дать невозможно. Теперь создатели AlphaFold представили ИИ для предсказания того, каким влиянием будет обладать тот или иной вариант в некодирующей области. Разработка получила название AlphaGenome.

AlphaGenome — это модель глубокого обучения, прогнозирующая, как последовательность ДНК повлияет на молекулярные фенотипы. Она принимает в качестве входных данных одну мегабазу ДНК и с разрешением до одной пары оснований предсказывает так называемые геномные треки, то есть связывает каждую пару оснований с результатами тех или иных экспериментальных данных. Модель обучена на геномах человека и мыши, а среди молекулярных фенотипов анализирует экспрессию генов, инициацию транскрипции и связывание транскрипционных факторов, модификации гистонов, карты хроматиновых контактов и доступность хроматина, координаты сайтов сплайсинга и их использование, сплайс-переходы — всего 11 категорий (модальностей).

Для демонстрации возможностей AlphaGenome авторы попробовали оценить эффекты клинически значимых вариантов в некодирующих участках вблизи онкогена TAL1. Производительность сравнивали с другими современными ИИ, специализированными для работы с конкретной модальностью (например, Orca для картирования контактов в геноме).

AlphaGenome достигла наилучших результатов в 22 из 24 задач предсказания геномных треков и 24 из 26 задач предсказания эффектов вариантов. После обучения AlphaGenome могла одновременно предсказывать 5 930 геномных треков для человека и 1 128 — для мыши.

Однако разработчикам еще предстоит решить ряд задач, чтобы улучшить созданную модель. Они уточняют, что AlphaGenome была обучена только на данных человека и мыши. Возможно, она будет работать и на других организмах, но исследователи этого не проверяли. Кроме того, доработки требует точность некоторых предсказаний — модель с трудом определяет влияние последовательности на экспрессию гена, если их разделяет расстояние более 100 тысяч пар оснований. «Эта модель еще не решила задачу регуляции генов в той же степени, в какой AlphaFold справляется с предсказанием 3D-структуры белков», — поясняет Аншул Кундадже, специалист по вычислительной геномике из Стэнфордского университета в Пало-Альто (Калифорния), который получил ранний доступ к AlphaGenome.

В перспективе разработчики планируют выпустить более полную версию, способную работать с еще более широким спектром приложений. Пока же доступ к AlphaGenome для некоммерческих исследований возможен через программный интерфейс.

Источник

Žiga Avsec, et al. AlphaGenome: advancing regulatory variant effect prediction with a unified DNA sequence model (25 июня 2025, препринт)

Цитата: DeepMind’s new AlphaGenome AI tackles the ‘dark matter’ in our DNA // Nature News (2025). DOI: 10.1038/d41586-025-01998-w


Добавить в избранное

Мы используем файлы cookie для улучшения работы сайта. Узнать больше.

Настройки файлов cookie

Мы используем файлы cookie для улучшения работы сайта, анализа трафика и показа персонализированной рекламы. Вы можете изменить настройки в любой момент.

Категории файлов cookie:

Необходимые

Эти cookie обеспечивают базовую функциональность сайта — вход в аккаунт, безопасность, оформление заказов. Отключение невозможно.

Функциональные

Функциональные cookie используются для обеспечения работы отдельных функций сайта, а также для запоминания ряда пользовательских предпочтений (например, выбранный язык, товары в корзине), с целью улучшения качества предоставляемого сервиса.

Отключение этого типа файлов cookie может привести к тому, что некоторые сервисы или функции сайта станут недоступны или будут работать некорректно. В результате, вам может потребоваться повторно вводить определённую информацию или настраивать предпочтения при каждом посещении сайта вручную.

Аналитические

Аналитические файлы cookie, включая сторонние аналитические cookie, помогают нам понять, как вы взаимодействуете с нашим сайтом. Эти файлы не собирают информацию, позволяющую установить вашу личность. Все данные обрабатываются в агрегированной и анонимной форме.

Рекламные

Рекламные cookie, включая сторонние, используются для создания пользовательских профилей и показа рекламы, соответствующей вашим интересам и предпочтениям при просмотре сайтов.

Эти cookie позволяют персонализировать рекламные сообщения, которые вы видите, делая их более релевантными. Они также могут использоваться для ограничения количества показов одной и той же рекламы и для оценки эффективности рекламных кампаний.