Выбор стратегий NGS и биоинформатических методов для поиска мутаций в раковых клетках

Международная группа ученых описала, как различные факторы влияют на точность и воспроизводимость детекции мутаций при секвенировании ДНК раковых клеток. Среди этих факторов — качество образцов, количество ДНК, протоколы создания библиотек, секвенаторы, программы для обработки информации, преаналитические (лабораторные) и аналитические повторности. Авторы также изложили свои рекомендации по выбору стратегии секвенирования в зависимости от качества образца, с которым приходится работать и целей.

Credit:
pogorelovaolga | 124rf.com

Технологии секвенирования нового поколения (NGS) становятся все доступнее и дешевле, поэтому их все более массово используют в клинической диагностике. В связи с этим встает вопрос о точности этих методов, поскольку многообразие существующих платформ и техник постановки реакции, детекции и анализа влияет на воспроизводимость результатов и процент ошибок.

Международная группа ученых из FDA, Университета Фудань и других научных центров анализировала разные подходы к секвенированию генома парных линий опухолевых (рак молочной железы) и нормальных клеток. Они определили факторы, влияющие на воспроизводимость и точность обнаружения соматических мутаций.

Дизайн эксперимента включал множество реальных сценариев из клинических лабораторий. Это подразумевает использование для анализа как образцов в парафине, зафиксированных формалином (FFPE), так и свежеполученных, гетерогенность образцов из биопсии, ограниченное количество ДНК, разные модели секвенаторов и аналитические инструменты.

Полногеномное секвенирование (WGS) и полноэкзомное секвенирование (WES) проводили в шести центрах. При WGS использовали набор для создания библиотек TruSeq и разные платформы: HiSeq 4000, HiSeq X10 и NovaSeq S6000. При WES сравнивали платформы HiSeq 1500, HiSeq 2500 и HiSeq 4000, а также три набора для создания библиотек: TruSeq, TruSeq-Nano и Nextera Flex. Всего получили 144 библиотеки и 144 набора данных секвенирования. Для анализа использовали пять вариант-коллеров (программ для идентификации мутаций): Lancet, MuTect2, Somatic Sniper, Srtelka2 и TNscope. Получили 1015 набора вариантов (call sets), по которым оценивали кросс-платформенную воспроизводимость определения мутаций в разных центрах.

Анализ данных показал, что использование WES приводило к большему разбросу результатов между лабораториями и оборудованием, меньшей воспроизводимости и большему количеству артефактов, чем WGS. Это связано с тем, что WES зависит главным образом не только от коллеров и покрытия, как WGS, но и от размеров фрагмента ДНК (вставки), G/C-состава и степени поврежденности ДНК. При этом в пределах одного центра результаты WES и WGS были сопоставимы по вариабельности. Кроме этого авторы показали, что преаналитические (лабораторные) повторности улучшают точность результатов и снижают влияние артефактов, тогда как аналитические повторности (разные пайплайны) могут при улучшении точности также увеличить и количество ложных результатов.

В статье авторы дают таблицу с рекомендациями по подбору платформ секвенирования и инструментов биоинформатики в зависимости от качества и природы доступных образцов и цели исследования. По их словам, их рекомендации позволят улучшить воспроизводимость результатов и точность выявления мутаций.

Источник

Wenming Xiao, et al. Toward best practice in cancer mutation detection with whole-genome and whole-exome sequencing // Nature Biotechnology 39, pages 1141–1150 (2021); DOI: 10.1038/s41587-021-00994-5

Добавить в избранное