Языковая модель для генерации мРНК оптимизирует экспрессию за счет нетранслируемых областей

Разработка терапевтических мРНК и мРНК-вакцин требует создания не только кодирующей последовательности, но и регуляторных областей, которые обеспечат оптимальный уровень экспрессии. В Science опубликована языковая модель GEMORNA, специализированная под разработку мРНК de novo. Она генерирует полноразмерную мРНК, содержащую как кодирующие участки, так и нетранслируемые области (5'-UTR и 3'-UTR), а также способна создавать кольцевые мРНК. Для демонстрации возможностей авторы сгенерировали мРНК эритропоэтина (линейную и кольцевую) и химерный антигенный рецептор к CD19, а также получили мРНК-вакцину от COVID-19. Сгенерированные последовательности обеспечивали высокую и стабильную экспрессию целевых генов в клеточных культурах и в организме мышей, превосходя коммерчески доступные аналоги.

Credit:
123rf.com

Вакцины на основе мРНК оказались успешной стратегией защиты от COVID-19. Однако для более широкого применения эта технология требует усовершенствования, поскольку разработка терапевтических мРНК сопряжена с рядом трудностей. Одну из сложностей представляет проектирование 5'-нетранслируемой области (5'-UTR), от особенностей которой зависит экспрессия целевого гена. Авторы статьи в Science представили генеративную модель для проектирования мРНК с улучшенной экспрессией и стабильностью. Разработка получила название GEMORNA.

Разработка 5'-UTR осложняется тем, что не все механизмы регуляции, связанные с этой областью, изучены в полной мере. Один из предложенных ранее подходов состоит в минимизации вторичной структуры 5'-UTR, другие основаны на машинном обучении — оптимальную структуру предсказывают, опираясь на уже охарактеризованные 5'-UTR. Ученые из Китая и США создали генеративную модель GEMORNA (название расшифровывается как generative model for RNA), которая адаптирована под кодирующие последовательности и 5'-UTR. Она представляет собой языковую РНК-модель и сочетает архитектуру трансформера с модулем кодировщика, который обрабатывает информацию о последовательности белка, и модулем декодера для генерации кодирующей части мРНК. Модель была обучена на существующих кодирующих последовательностях, однако оказалась способна генерировать и мРНК, отличающиеся от природных.

Для демонстрации возможностей GEMORNA исследователи спроектировали с ее помощью мРНК светлячковой люциферазы, модифицированную N1-метилпсевдоуридином (m1Ψ). Сгенерированную мРНК экспрессировали в клетках HEK293T. Она обеспечивала стабильную экспрессию люциферазы — ее уровень до 41 раза превышал показатели, достигнутые с помощью более классических эталонных конструктов.

Авторы также проверили модель на синтетических кодирующих последовательностях — они синтезировали мРНК-вакцины против COVID-19. Сравнение с коммерческим дизайном показало, что мРНК, сгенерированные GEMORNA, обеспечивали более высокий титр антител в крови вакцинированных мышей.

Следующим этапом стала разработка терапевтической мРНК — ученые сгенерировали полноразмерную мРНК, кодирующую эритропоэтин. Шесть из семи предложенных вариантов обеспечивали более высокую экспрессию, чем эталонная оптимизированная последовательность; в одном случае экспрессия также длилась дольше. Три наиболее перспективных варианта авторы протестировали in vivo — в организме мышей они добились стабильной экспрессии, которая до 15 раз превышала экспрессию с эталонной мРНК.

Исследователи получили с помощью GEMORNA не только линейные, но и кольцевые мРНК — они устойчивее к экзонуклеазам, поэтому обеспечивают более продолжительную и стабильную экспрессию. Этот подход подтвердили на мРНК эритропоэтина. Ученые сгенерировали три последовательности, и все они обеспечивали намного более высокие уровни эритропоэтина in vivo, чем контрольная мРНК — наиболее эффективный вариант обеспечивал 121-кратное превышение экспрессии через 24 часа. Экспрессия также была стабильнее, она сохранялась на повышенном уровне в течение 168 часов.

Наконец, ученые сгенерировали последовательности химерных антигенных рецепторов (CAR) в составе кольцевой мРНК. Экспрессия в Т-клетках человека показала, что новые конструкты дают в 5,6 раз более высокий уровень экспрессии CAR к CD19, чем коммерческие аналоги. Кроме того, 50% клеток оставались CD19 CAR-положительными через 120 часов после электропорации сгенерированной последовательностью мРНК, тогда как в эталонном варианте их становилось меньше половины уже к 72 часам.

Созданная генеративная ИИ-модель, таким образом, представляет собой эффективную стратегию для конструирования последовательностей мРНК. Авторы рассчитывают, что она подтолкнет и без того перспективное направление разработки мРНК-вакцин и терапевтических мРНК, расширяя возможности их создания.


Evoлюция моделирования генома: генерация последовательностей и предсказание значимости мутаций с помощью ИИ

Жизнь терапевтической мРНК продлил ветвистый хвост

Источник

He Zhang et al., Deep generative models design mRNA sequences with enhanced translational capacity and stability. // Science, 2025. DOI: 10.1126/science.adr8470

Добавить в избранное