Вакансия: Senior AI Researcher

Senior AI Researcher

до 500 000 руб. до вычета налогов

Uniphage

Требуемый опыт работы: 3–6 лет

Полная занятость, полный день

Our exciting startup that uses NLP to "understand" and "engineer" genomes to cure bacterial and fungal diseases is looking for a senior AI researcher (NLP) to help us achieve our goal! Additional experience in biotechnology, genomics, and/or bioinformatics is highly welcomed but not required!

The work will be mostly remote but some office presence might be required (negotiable + fully remote work is possible). Therefore, applicants from any region are welcome to apply!

Degree requirements: PhD in Data Science (strongly preferred). Someone with an MS who has extensive experience in the NLP + deep learning field will be considered.

Language requirements: full English proficiency is required (non-negotiable) as all work will be done in English.

Other requirements:

1. Experience with managing teams and hiring tech professionals
2. Desire to work in a fast-paced and fast-changing startup environment
3. Desire to make a difference with your work
4. Proactiveness and ability to work independently
5. Ability to adjust work schedule to attend weekly meetings in the US time
6. Ability to travel to the US quarterly (visa problems are on us to solve)

The start date is negotiable (Q1-Q2 of 2022 is our current timeline).

Applications are considered on a rolling basis.

We're looking forward to reading your application!

Доступно соискателям с инвалидностью 

Ключевые навыки

Английский — C2 — В совершенстве

Natural Language Processing

Genomics (preferable)

Deep Learning

Unsupervised Machine Learning

Experience Managing Teams

NLP

Full English Proficiency

Вакансия опубликована 26 ноября 2021 в Москве

Подробнее:

https://hh.ru/vacancy/49965312

Добавить в избранное

Вам будет интересно

24.05.2024
433
0

Дети матерей-билингвов, слышавшие во время внутриутробного развития речь на двух языках, иначе воспринимают звуки. Чтобы это выяснить, исследователи отслеживали активность мозга 129 младенцев (76 — от билингвальных матерей) с помощью трех закрепленных на голове электродов. Они измеряли вызванный слуховой потенциал в ответ на звуковой стимул из двух гласных /oa/, определяя его спектр в зависимости от тона и тембра голоса. Оказалось, что амплитуда записанных спектров не различалась между детьми моно- и билингвальных матерей в ответ на тон голоса (хотя соотношение сигнал-шум было ниже у детей билингвов), но у монолингвальных новорожденных она была выше на частоте, связанной с тембром. Исследователи пришли к выводу, что дети, рожденные от билингвов, более комплексно реагируют на звуки и поэтому способны обрабатывать более богатый диапазон частот. Подробнее

Почему у обезьян-носачей такие носы? Этим вопросом задались авторы статьи в Scientific Reports — они проанализировали черепа носачей и показали, что особая структура носовой полости служит для акустической сигнализации и внешней демонстрации социального статуса самца. Ученые также подтвердили, что способность громче издавать вокализации трех типов подвергалась у носачей половому отбору. Подробнее

Искусственный интеллект предсказал поведение плодовой мушки. Для этого ученые записали поведение самца мушки во время ухаживания за самкой. Затем они последовательно нокаутировали те или иные гены в зрительных нейронах и обучили ИИ отслеживать изменения в поведении. В результате модель смогла предсказать, как будет вести себя самец при виде самки. Исследователи объясняют: сочетания нейронов зрительной проекции управляют взаимодействием самца с самкой, даже если эти нейроны не связаны с социальным поведением напрямую. Предложенная модель позволила сопоставить стимулы, типы нейронов и поведение мушки. Подробнее.

Биофизики смоделировали действие кетамина на разные нейронные контуры мозга и проверили его на человеке. В малых дозах кетамин усиливал активность в диапазоне быстрых гамма-волн (30-40 Гц), а при более высоких дозировках эти гамма-волны прерывались очень медленными дельта-волнами. Такое прерывание гамма-волновой активности, по-видимому, и связано с отключением сознания на высоких дозах кетамина. Авторы также выдвинули две гипотезы, объясняющие механизм такого влияния на активность мозга. Подробнее.  

В Финляндии недавно обнаружилась популяция кошек с необычным окрасом, который исследователи назвали «лакричным» — темная шерсть таких кошек содержит волоски с белыми кончиками. Генетики проанализировали причины появления такого окраса и выяснили, что дело в гене KIT, а точнее, в 95-килобазной делеции в его 3’-фланкирующем регионе.  Подробнее

06.05.2024
677
0

Классическая разработка лекарств происходит по модели «одна болезнь — одна мишень — один препарат». Однако многие заболевания не имеют единой молекулярной причины, и вмешиваться в их развитие можно на различных уровнях. Один из потенциальных подходов к таким болезням — это полифармакология (использование соединений, влияющих на несколько мишеней одновременно), однако полифармакологические препараты сложно разрабатывать. Авторы статьи в Nature Communications применили для их дизайна искусственный интеллект.

Ученые разработали подход, основанный на генеративном обучении с подкреплением. Платформу назвали POLYGON; она генерирует новые молекулярные структуры и отбирает среди них оптимальные на основании их способности ингибировать оба заданных белка-мишени, а также простоты синтеза. Используя данные о связывании более 100 тысяч соединений, POLYGON распознала полифармакологические взаимодействия с точностью 82,5%. Убедившись в такой способности платформы, авторы работы разработали с ее помощью соединения, нацеленные на 10 пар белков, для которых уже подтверждены взаимодействия в клетке. Они провели анализ докинга и выяснили, что наиболее перспективные соединения связывают каждую из мишеней подобно тому, как это делают препараты, нацеленные на единственный белок.

Для валидации подхода из предложенных соединений исследователи отобрали 32 кандидата, нацеленные на MEK1 и mTOR, синтезировали эти соединения и протестировали их на клеточной модели. Оказалось, что большинство разработанных молекул в концентрации 10 мкМ снижали активность каждого из белков более чем на 50%; их концентрация полумаксимального ингибирования (IC50) лежала в диапазоне 1–10 мкМ. Уровень ингибирования киназ сильно коррелировал с жизнеспособностью клеток, которая также снижалась более чем на 50% при использованных концентрациях. Синтезированные соединения работали с достаточно высокой специфичностью — за исключением одного случая, они снижали активность других киназ не более чем на 20%. Полученные результаты подтверждают потенциал применения генеративных моделей в полифармакологии.

08.04.2024
505
0

Динозавры и маммалиаформы мезозоя нарушали правило Бергмана, сообщается в недавнем исследовании британских и американских ученых. Правило Бергмана гласит, что среди сходных гомойотермных (теплокровных) животных более крупными размерами тела обладают те, которые живут в более холодных широтах. Изначально предложенное для млекопитающих, правило было применено и к птицам, а также к пойкилотермным (холоднокровным) животным, включая амфибий, рептилий, рыб и беспозвоночных, хотя для пойкилотермных время от времени наблюдается обратная картина. Проанализировав ископаемые останки тысяч видов динозавров и маммалиаформ (предков современных птиц и млекопитающих, соответственно), ученые пришли к выводу, что эволюция размеров их тела не зависела от широты. Подробнее.

Языковые модели уже продемонстрировали эффективность в расшифровке функций геномных и белковых последовательностей. Теперь же ученые сфокусировались на мРНК — они представили языковую модель для 5′ нетранслируемой области (5′ UTR), обучив ее на эндогенных 5′ UTR нескольких видов. С помощью этой модели ее создатели разработали 211 новых 5′ UTR и экспериментально показали, что некоторые из конструкций увеличили продукцию белка на 32,5% по сравнению с ранее полученными 5′ UTR, которые были оптимизированы для терапевтического применения.  Авторы работы рассчитывают, что их подход найдет применение в разработке и улучшении терапевтических мРНК. Подробнее.

Экологическая ДНК (эДНК, environmental DNA) поможет оценить здоровье коралловых рифов, пишут ученые из Массачусетса. Микробиота кораллового рифа играет важную роль в поддержании его здоровья, а на нее, в свою очередь, могут влиять такие факторы, как ураганы или вспышки заболеваний. Авторы статьи предложили неинвазивный подход к изучению микробных сообществ коралловых рифов — анализ эДНК — который позволяет оперативно оценить, как внешние факторы повлияли на коралловые рифы и на их микробиом. Такая диагностика, в свою очередь, поспособствует своевременному принятию мер по поддержке экосистем коралловых рифов. Подробнее.

Может ли единый биомаркер, основанный на видео, улучшить стратификацию риска развития стеноза аорты? Авторы статьи, опубликованной на страницах JAMA Cardiology, отвечают на этот вопрос утвердительно. Они провели многонациональное когортное исследование и показали, что новый выявляемый ИИ биомаркер стеноза аорты (Digital AS Severity Index), полученный с помощью видеозаписи, был достоверно связан с повышенным риском рецидива стеноза аорты, более быстрым прогрессированием (его выявляли с помощью допплерэхокардиографии) и заменой аортального клапана в будущем. Подробнее.

Виртуальная реальность облегчает боль у онкологических больных. В испытании участвовали 128 взрослых пациентов с разными типами опухолей. В одной группе терапия была основана на виртуальной реальности, в другой — задействовала двухмерные образы, управляемые с помощью планшета. Облегчение боли наблюдалось в обеих группах, однако в группе виртуальной реальности оно оказалось более значительным, и эффект сохранялся дольше. Подробнее.

05.04.2024
599
0

Подобно словам в естественном языке, ген может обладать различными функциями в зависимости от контекста, а многие гены, напротив, могут наделяться близкими функциями вследствие конвергентной эволюции или отдаленной гомологии. Расшифровка связи между геном и его контекстом имеет фундаментальное значения для моделирования биологических систем. Для исследования этой связи перспективно машинное обучение — именно к нему прибегли ученые из США, которые создали геномную языковую модель.

Для обучения больших языковых моделей, таких как GPT-4, применяются огромные массивы разнообразных текстовых данных. Геномная языковая модель обучается на наборах метагеномных данных, с помощью которых она учится понимать функциональную «семантику» и регуляторный «синтаксис» отдельных генов. Авторы, опубликовавшие статью в Nature Communications, обучили геномную языковую модель на миллионах метагеномных скаффолдов. Метагеномы, включенные в обучение, были получены из различных сред, включая почву, океан и кишечник человека.

Исследователи показали, что их геномную языковую модель можно использовать для решения различных задач. Так, она была способна предсказывать функции ферментов, предсказывать опероны, определять таксономическую принадлежность контигов или соотносить паралоги между собой. Ученые считают, что геномные языковые модели — весьма перспективное направление, подчеркивают, что архитектура трансформера показала себя успешной как в обработке естественных языков, так и в их модели. Кроме того, благодаря развитию секвенирования с длинными прочтениями можно ожидать увеличения качества, количества и разнообразия входных данных — и авторы надеются на развитие обсуждаемого направления машинного обучения. Геномные языковые модели, отмечают они, позволят установить связи между молекулярной структурой и функциями на организменном уровне, а следовательно, приблизят нас к моделированию биологических систем и манипулированию ими.

21.02.2024
1067
0

Индексы полигенного риска (PRS), основанные на совокупности генетических вариантов, могут использоваться для прогнозирования предрасположенности человека к той или иной болезни. Однако их применение в клинической практике затрудняется различным происхождением пациентов и проблемами интерпретации результатов. Авторы публикации в Nature Medicine задались целью улучшить прогностические характеристики PRS для популяций разного происхождения.

Исследователи работали в коллаборации с национальной сетью электронных медицинских карт и геномики (eMERGE), которая финансируется Национальным институтом исследования генома человека. Они проанализировали показатели риска для 25 000 взрослых и детей. В работу вошли десять патологий: мерцательная аритмия, рак молочной железы, хроническая болезнь почек, ишемическая болезнь сердца, гиперхолестеринемия, рак простаты, астма, диабет 1 и 2 типа и ожирение. Участников исследования разделили на четыре группы по происхождению: европейское, африканское, латиноамериканское и азиатское. В каждой из групп определили пороговые значения высокого и низкого риска развития конкретного заболевания. Авторы также занялись вопросом внедрения PRS в клиническую практику — передачей результатов в клинические лаборатории, их валидацией и проверкой эффективности. Они не обошли стороной и создание клинических отчетов, которые передавались бы врачам и их пациентам и позволяли учесть генетическую оценку риска. «Нам было важно убедиться, что мы не предоставляем людям результаты, с которыми они ничего не могут сделать», — комментирует Найл Леннон, первый автор работы.

Говоря о дальнейших исследованиях, авторы упоминают возможность стандартизации анализов и методов, используемых для определения этих пороговых значений. Кроме того, для большей клинической пользы, подчеркивают исследователи, важно рассчитывать абсолютный риск, основанный не только на индексе полигенного риска, но и на возрасте — в тех случаях, где это возможно (например, для сердечно-сосудистых заболеваний).