Разработан симулятор реалистичных омиксных данных
Активное развитие омиксных подходов ставит перед современной наукой задачу разработки методов процессинга и анализа данных, а также валидации этих методов. Для валидации алгоритмов обработки можно применять большие объемы данных с заданными параметрами. Для объективного контроля при таком подходе необходимы данные in silico, которые обладают заранее известными характеристиками и достоверно имитируют реальные данные, что требует наличия реалистичных симуляторов. На этой неделе в Nature Biotechnology представили статистический симулятор для генерации омиксных данных.
Симулятор, названный scDesign3, работает по принципу вероятностной модели и генерирует разнообразные синтетические датасеты, в том числе результаты анализа единичных клеток и пространственные омиксные данные. С помощью scDesign3 можно генерировать наборы данных, обладающих теми или иными параметрами в соответствии с заданной исследователем гипотезой. Кроме того, симулятор предлагает интерпретацию полученных данных, выводя биологически значимые параметры на основе правдоподобия для оценки соответствия предполагаемых кластеров клеток, траекторий и пространственных местоположений. Модель также генерирует отрицательные и положительные контроли для сравнительного анализа вычислительных инструментов.
Такой симулятор может стать полезным инструментом для разработки и дальнейшего улучшения алгоритмов анализа омиксных данных, поскольку на его выдачу можно опираться для оценки качества их работы.