Genomics England создает платформу для мультимодального представления онкологических данных

Компания Genomics England планирует создать новую платформу для исследований рака, которая обеспечит доступ к огромному количеству геномных, фенотипических и имаджинговых данных, необходимых для развития диагностики и терапии онкозаболеваний. Проект может быть запущен уже к концу 2022 года.

Credit:
123rf.com

Genomics England, финансируемая правительством Великобритании, обнародовала дополнительную информацию о платформе, которую она надеется запустить в декабре 2022 года. В марте Genomics England сообщила о сотрудничестве с компанией Insitro (Южный Сан-Франциско, штат Калифорния), которая занимается поиском и разработкой лекарств. Технология машинного обучения Insitro будет применена к гистопатологическим изображениям и связанным с ними геномным данным в базе данных Genomics England, чтобы сформировать мультимодальное представление клинических данных. В результате появится возможность искать изображения, биопсии и клинические случаи на основе семантического, а не визуального сходства. Создание ресурса финансируется правительством Великобритании через Департамент здравоохранения и социального обеспечения.

Данные геномики, патологии и радиологии часто хранятся в разных форматах, используются различными медицинскими дисциплинами. Новая платформа Genomics England существенно увеличит их реальную доступность для ученых и клиницистов.

На прошлой неделе во время саммита, который проходил в Лондоне и онлайн, генеральный директор Insitro Дафна Коллер и главный коммерческий директор Genomics England Паркер Мосс обсудили дальнейшие усилия в этом направлении. Коллер назвала этот проект «захватывающей возможностью позволить биологии говорить на своем собственном языке»: «То, что мы создаем вместе с Genomics England, — это возможность мультимодального поиска, которая позволяет исследователям и клиницистам делать запросы к набору данных Genomics England, используя этот язык изображений, который мы изучили, а со временем и другие модальности по мере их приобретения».

Мосс добавил, что этот ресурс позволит исследователям находить похожих пациентов в базе данных не только на основе фенотипирования, но и «на основе сложных функций визуализации, которые будут встроены в наш набор данных». Genomics England называет работу с Insitro «центральной частью мультимодального проекта».

В электронном письме Мосс подтвердил для GenomeWeb, что первая порция данных визуализации, для которых уже есть соответствующие данные секвенирования опухоли и нормального генома, а также некоторые другие омиксные данные, должна быть доступна к концу года. Прабху Арумугам, директор по клиническим данным и визуализации Genomics England, добавил, что партнеры компании из Национальной кооперации патологии и визуализации (NPIC) намерены завершить обработку около 300 000 изображений от 16 000 участников проекта 100,000 Genomes к середине 2023 года. Основанная в 2013 году Genomics England в партнерстве с NHS возглавила проект 100,000 Genomes и всегда была связана с ним

Дал Бансал, операционный директор NPIC, отметила в своем выступлении на саммите, что NPIC — крупнейший из пяти британских центров передового опыта в области цифровых изображений и искусственного интеллекта, созданных в 2019 году. У NPIC есть ряд партнеров, в том числе японская Futamura и британская FFEI, которые поддерживают обработку изображений; Leica и Roche, которые предоставили сканеры; и mTuitive, американская фирма, предлагающая программное обеспечение для сбора данных и составления отчетов. По словам Бансал, NPIC работает над созданием архива, независимого от поставщика: он может работать с любым ИИ, любым сканером и любым программным обеспечением.

Все эти данные по визуализации теперь объединяются с геномными данными Genomics England. По словам генерального директора компании Криса Ригли, ее ресурсы в включают 60 петабайт данных, по 150 000 геномов, и все связанные с ними клинические данные. Genomics England также заявила, что новая платформа сочетается с ее инициативой Cancer 2.0 по использованию мультимодальных данных, результатов секвенирования длинных ридов и метилирования.

Компания Genomics England признала, что моделью для ее платформы послужил Атлас генома рака ( TCGA), созданный Национальным институтом рака США, который предоставляет доступ к данным 11 000 пациентов. Ресурс Genomics England будет включать данные о примерно 16 000 больных раком.

Также Genomics England сообщила, что первая публикация, связанная с использованием ее платформы и посвященная раку мозга, будет опубликована в 2023 году.

Мэтт Браун, руководитель по научной работе компании, отметил, что, поскольку Genomics England была создана для изучения британского населения, в наборе преобладают данные людей европейского происхождения, которые составляют около 85% от общей численности населения Великобритании. Сейчас Genomics England секвенирует около 25 000 человек из недопредставленных этнических групп. Кроме того, среди ученых, использующих исследовательскую библиотеку и среду Genomics England, 94% базируются в Великобритании, и эту ситуацию необходимо изменить, считает Мэтт Браун. Более разнообразный набор данных должен привлечь больше внимания глобального исследовательского сообщества.

Источник

Justin Petrone. Genomics England Provides Update on New Cancer Research Platform // GenomeWeb. May 10, 2022

Добавить в избранное