Разработан симулятор реалистичных омиксных данных

Активное развитие омиксных подходов ставит перед современной наукой задачу разработки методов процессинга и анализа данных, а также валидации этих методов. Для валидации алгоритмов обработки можно применять большие объемы данных с заданными параметрами. Для объективного контроля при таком подходе необходимы данные in silico, которые обладают заранее известными характеристиками и достоверно имитируют реальные данные, что требует наличия реалистичных симуляторов. На этой неделе в Nature Biotechnology представили статистический симулятор для генерации омиксных данных.

Симулятор, названный scDesign3, работает по принципу вероятностной модели и генерирует разнообразные синтетические датасеты, в том числе результаты анализа единичных клеток и пространственные омиксные данные. С помощью scDesign3 можно генерировать наборы данных, обладающих теми или иными параметрами в соответствии с заданной исследователем гипотезой. Кроме того, симулятор предлагает интерпретацию полученных данных, выводя биологически значимые параметры на основе правдоподобия для оценки соответствия предполагаемых кластеров клеток, траекторий и пространственных местоположений. Модель также генерирует отрицательные и положительные контроли для сравнительного анализа вычислительных инструментов.

Такой симулятор может стать полезным инструментом для разработки и дальнейшего улучшения алгоритмов анализа омиксных данных, поскольку на его выдачу можно опираться для оценки качества их работы.

Добавить в избранное

Вам будет интересно

16.03.2026
310
0

UK Biobank содержит медицинские записи 500 тысяч британских добровольцев — это один из самых обширных в мире биобанков, где хранятся геномные последовательности участников вместе с постоянно пополняемой информацией о здоровье и образе жизни. В прошлом месяце правительство расширило доступ UK Biobank к медицинским картам добровольцев. Эти данные используют в исследованиях десятки тысяч ученых из разных стран, результаты представлены в тысячах публикаций. Расследование газеты Guardian выявило десятки случаев утечки медицинской информации из UK Biobank, связанных с работой исследователей.

Научные журналы и спонсоры требуют от исследователей публикации кода, использованного ими для анализа больших наборов данных. При попытке загрузить код на популярную онлайн-платформу GitHub некоторые авторы статей случайно публиковали наборы данных UK Biobank, частично или полностью. Хотя эти данные не содержат имен или адресов, они позволяют получить доступ к медицинской информации о человеке. С июля по декабрь 2025 года биобанк направил 80 юридических уведомлений в адрес GitHub с просьбой удалить такие данные, и это было сделано, однако значительная их часть по-прежнему доступна.

Один из наборов данных, обнаруженных Guardian, содержал датированные больничные диагнозы примерно для 413 тысяч участников, а также их пол, месяц и год рождения. В порядке эксперимента Guardian с согласия одной из участниц проекта провела поиск по месяцу и году ее рождения вместе с информацией о перенесенной операции и получила доступ к диагнозам, поставленным в больнице. Женщина продолжит участвовать в проекте, так как считает его важным, но задается вопросом, не нарушено ли обещание защитить данные добровольцев.

В UK Biobank заявили, что реидентификация человека невозможна без дополнительной информации и по этой причине участникам рекомендуют не размещать на общедоступных сайтах сведения о своем здоровье или генеалогические данные. Представители биобанка также отметили, что продолжат принимать меры для защиты данных участников. Эксперты по вопросам конфиденциальности отмечают, что подход UK Biobank «противоречит реальности»: в наше время невозможно рассчитывать на отсутствие в интернете информации о здоровье человека.

27.06.2025
2086
0

Считается, что у эволюции нет кнопки обратной перемотки — она рассматривается как однонаправленный путь адаптаций. Однако авторы статьи в Nature Communications описали возможный случай «обратной эволюции» у дикорастущих томатов на островах Галапагосского архипелага.

Ученые проанализировали стереохимические особенности стероидных алкалоидов — они играют у растений важную защитную роль — в семействе пасленовых (Solanaceae), к которым относится томат. Этим алкалоидам свойственна стереоизомерия по 25-му атому углерода, и варианты гидроксилаз GAME8 (glycoalkaloid metabolism 8), отвечающие за их синтез, продуцируют S- или R-изомеры. Филогенетический анализ пасленовых выявил две клады, представители одной из которых преимущественно синтезируют 25S изомеры (к этой кладе относится томат), а другой — более эволюционно древние 25R. Один из алкалоидов этой группы — α-томатин — служит для защиты от грибковых инфекций и насекомых-вредителей. Анализ различных популяций томатов показал, что растения на древних территориях вырабатывают преимущественно 25S-изомер α-томатина. Однако у дикорастущих томатов с Галапагосских островов обнаружились мутации в GAME8, которые привели к переходу от синтеза 25S-изомера этого защитного алкалоида обратно к предковым 25R. Ученые предполагают, что древний вариант оказался более надежным средством защиты на вулканических островах, сравнительно недавно заселенных томатами, и это привело к «откату» эволюции фермента.

23.04.2025
1915
0

Группа под руководством геобиологов из Бельгии описала новый вид кабельных бактерий — многоклеточных прокариотических организмов, способных проводить электричество на сантиметровые расстояния.

Клетки кабельных бактерий имеют палочковидную форму и соединяются между собой в нити, покрытые общей внешней мембраной. Они могут переносить электрический заряд между слоями осадочных пород — это основа их метаболизма. Электроны переносятся из более глубоких слоев осадка, где бактериальные клетки осуществляют окисление сульфида, на поверхность, где другие клетки используют кислород или нитрат в качестве конечного акцептора электронов.

В настоящее время кабельные бактерии включают два признанных рода, Candidatus Electrothrix и Candidatus Electronema. Теперь же исследователи выделили из приливно-отливной эстуарной зоны в заливе Якина (Орегон, США) новый вид. Он морфологически отличается от описанных ранее кабельных бактерий, а его метаболические пути и гены — смесь таковых Ca. Electrothrix и Ca. Electronema. Отличительной чертой вида оказались широкие поверхностные гребни, которые тянутся по всей длине каждого бактериального филамента и содержат проводящие волокна. Эти волокна включают никель-содержащий кофактор NiBiD, описанный исследователями впервые. Филогенетически новый вид кабельных бактерий оказался ближе к первому из родов, и авторы предлагают назвать его Ca. Electrothrix yaqonensis sp. nov., в честь племени якина — коренных американцев, чьи исконные земли охватывают залив Якина.

04.04.2025
1432
0

Микроорганизмы доминируют в биосфере, но отследить их раннюю эволюцию проблематично из-за отсутствия окаменелостей. Однако древние отложения и горные породы могут указать на особенности метаболизма бактерий в тот или иной период. Авторы статьи в Science проанализировали их, чтобы составить карту эволюции аэробных микроорганизмов.

Кислородную катастрофу, которая случилась около 2,43–2,33 млрд лет назад из-за возникновения оксигенного фотосинтеза, исследователи называют ключевым поворотным моментом, преобразовавшим биосферу. Они выстроили связь между распространением аэробного метаболизма и временем накопления кислорода в атмосфере, а затем использовали эту связь для более точной датировки филогенетического древа бактерий, построенного на 1007 видах.

Биоинформатический анализ выявил 84 события перехода от анаэробного метаболизма к аэробному. Большинство произошло после кислородной катастрофы и было обусловлено горизонтальным переносом генов, связанных с дыханием и толерантностью к кислороду. Однако по крайней мере три перехода предшествовали этому событию. По полученным данным, самые первые аэробные бактерии появились в архее, на 900 миллионов лет раньше кислородной катастрофы. После нее аэробные линии эволюционно расходились намного быстрее, чем анаэробные, что подчеркивает влияние уровня атмосферного кислорода на эволюцию бактерий. Исследователи заключают: если аэробное дыхание возникло до повсеместной оксигенации атмосферы, оно могло способствовать эволюции оксигенного фотосинтеза у цианобактерий.

27.02.2025
1317
0

При диабете необходимо тщательно контролировать уровень глюкозы в крови. Однако это сложная задача — лишь около трети людей с диабетом 2 типа удается поддерживать данный показатель в безопасном диапазоне. Авторы статьи в The Lancet создали модель, предназначенную для подбора оптимальной стратегии лечения.

Модель, исходно обученная на данных ряда клинических испытаний, предсказывает эффективность основных классов противодиабетических препаратов для конкретного пациента, чтобы выбрать среди них оптимальный. Этих классов пять: ингибиторы дипептидилпептидазы-4 (DPP-4), агонисты рецепторов глюкагоноподобного пептида-1 (GLP-1R), ингибиторы натрий-глюкозного котранспортера-2 (SGLT2), сульфонилмочевина и тиазолидиндионы. Предсказание опирается на девять показателей: возраст, пол, давность постановки диагноза (сколько лет пациент уже живет с диабетом), индекс массы тела (ИМТ), исходный уровень гликированного гемоглобина (HbA1c) в крови, содержание липопротеинов высокой плотности, общего холестерина, аланинаминотрансферазы (АЛТ), а также скорость клубочковой фильтрации (eGFR). Все количественные признаки измеряются на момент начала лечения.

Исследователи убедились, что модель достаточно точно предсказывает, как тот или иной класс препаратов снизит уровень гликированного гемоглобина за 12 месяцев лечения. Валидацию проводили на жителях Англии, страдающих диабетом 2 типа. Оказалось, что лекарства, классифицированные моделью как «оптимальные», впоследствии снижали уровень гликированного гемоглобина в крови примерно на 5 ммоль/моль сильнее, чем «неоптимальные». Также ученые пришли к неутешительному выводу: в Великобритании только 18% пациентов с диабетом 2 типа получают наиболее эффективный для них препарат, снижающий уровень глюкозы.