Evo обучили генерировать не только бактериальные, но и эукариотические геномы
В ноябре 2024 года в Science опубликовали статью о создании геномной генеративной модели
Evo. Этот ИИ способен предсказывать ключевые характеристики той или иной ДНК и генерировать последовательности «с нуля» — как отдельные гены, так и целые геномы. Однако Evo обучали только на прокариотических геномных данных, поэтому генерация также ограничивалась последовательностями, характерными для бактерий и архей.
Теперь же на сайте некоммерческой исследовательской организации Arc Institute опубликован пресс-релиз, в котором сообщается, что разработчики выпустили новую версию — Evo 2. В отличие от предшественника, Evo 2 обучали на геномах как прокариот, так и эукариот, в том числе многоклеточных. В обучающую выборку вошло более 128 тысяч полных геномов (в том числе геном человека) и метагеномные данные — в общей сложности 9,3 триллиона пар оснований. По словам авторов, это крупнейшая на сегодняшний день ИИ-модель в биологии.
Evo 2 продемонстрировал универсальность и надежность в выявлении характеристик ДНК, влияющих на кодируемый ей белок. Например, среди вариантов гена BRCA1, ассоциированного с раком молочной железы, модель отличала доброкачественные мутации от потенциально патогенных
с точностью более 90%. Также Evo 2, как генеративная модель, станет ценным инструментом дизайна генов de novo — для исследовательских целей или лечения, такого как генная терапия. Препринт статьи о разработке Evo 2 доступен на
сайте института.