Машинное обучение помогает выявить побочные эффекты лекарств

Новое в СХД Маркет

Многонациональная группа исследователей во главе с учеными Гарвардской медицинской школы и Института биомедицинских исследований Novartis, разработала механизм, который позволяет идентифицировать белки, связанные с побочными эффектами лекарств. Для создания нового инструмента были применены технологии машинного обучения на основе ПО с открытым исходным кодом.


Исследование реакций на молекулярном уровне

Выявление потенциальных побочных эффектов в новых лекарствах является — одним из важнейших и наиболее ответственных этапов, необходимых для того, чтобы тот или иной препарат получил доступ на рынок. Но, процесс всесторонних лабораторных исследований крайне сложный, затратный и длительный. Здесь очень помогает вычислительная техника, оснащенная специальным ПО, но возможности ее все еще очень ограничены. Чтобы повысить эффективность компьютерных симуляций ученые используют алгоритмы машинного обучения.

Новое исследование, опубликованное 18 июня 2020 г. в авторитетном международном научном журнале Lancet EBioMedicine, предлагает новый метод разработки более безопасных лекарств путем выявления потенциальных побочных реакций до того, как вещества-кандидаты попадут на этап клинических испытаний на людях или поступят на рынок. Результаты исследования также дают представление о том, как человеческий организм реагирует на лекарственные соединения на молекулярном уровне. «Машинное обучение не является серебряной пулей в области открытия лекарств, но я верю, что оно может ускорить различные аспекты в сложном и длительном процессе разработки новых препаратов. Хотя он не может предсказать все возможные неблагоприятные последствия, мы надеемся, что наша работа поможет исследователям обнаружить потенциальные проблемы на раннем этапе и разработать более безопасные лекарства в будущем», — сказал один из соавторов статьи Роберт Ицваарт (Robert Ietswaart).

Машинное обучение на службе у медицины

Побочные эффекты лекарств варьируются в широком диапазоне вплоть до смертельных исходов. Они могут возникать при приеме лекарственного средства в соответствии с назначением, в результате неправильных дозировок, взаимодействия нескольких лекарств или использования не по назначению. По различным данным неблагоприятные побочные реакции на лекарства приводят к миллионам госпитализаций ежегодно, не считая случаев, когда люди не обращаются за медицинской помощью.

Машинное обучение поможет оперативно выявлять потенциальные побочные эффекты на раннем этапе исследования.

Исследователи и медицинские работники применяли много тактик на протяжении десятилетий, чтобы избежать или, по крайней мере, минимизировать побочные реакции от лекарства. Но поскольку один препарат часто взаимодействует сразу с несколькими белками в организме — не всегда ограничиваясь целевыми типами протеинов — бывает очень трудно предсказать, какие побочные эффекты может вызвать то или иное вещество. Более того, если побочный эффект все-таки выявлен, еще необходимо установить, какой из белковых «мишеней» несет ответственность за негативный процесс.

В новом исследовании ученые взяли две крупные базы данных — одну о зарегистрированных побочных реакциях на лекарства и другую, включающую 184 вида белков, с которыми чаще всего они взаимодействуют. Затем они создали компьютерный алгоритм для выявления механизмов работы. В результате удалось установить 221 связь между отдельными белками и специфическими побочными реакциями на лекарства. Некоторые были известны ранее, но часть выявлена впервые. Это дало ученым надежду на то, что созданный алгоритм может помочь с прогнозами побочных эффектов до того, как лекарство будет испытано на людях.

Хакатон как двигатель прогресса

Проект родился в рамках научного хакатона, организованного Институтом биомедицинских исследований Novartis (NIBR) в 2018 г. Команда-победитель, собранная из представителей различных профильных институтов и лабораторий, используя программное обеспечение с открытым исходным кодом, создала уникальный алгоритм машинного обучения и применила его к двум большим наборам данных. Один набор был предоставлен от Novartis и содержал информацию о белках и их взаимодействии с 2000 препаратов, второй набор, содержащий информацию о 600 тыс. обращений в медицинские учреждения о побочных реакциях на лекарства был получен от управления по санитарному надзору за качеством пищевых продуктов и медикаментов США (FDA). «Машинное обучение уже сейчас активно используется в ряде отраслей, помогая упростить и ускорить работу самых разных специалистов и систем, снизить затраты и минимизировать риски, однако его потенциал гораздо больше, чем решение рутинных бизнес-задач. Описанный алгоритм выявления побочных эффектов лекарств — важный шаг для развития не только фарм-индустрии, но и всей отрасли здравоохранения, — говорит Татьяна Бочарникова, глава представительства NetApp в России и странах СНГ. — Подобные разработки и исследования требуют надежных и современных решений для хранения и обработки данных. Компания NetApp уже много лет плотно сотрудничает с отраслью и предоставляет полный спектр необходимых технологий и сервисов».

Чтобы убедиться, что алгоритм надежен, команда исследователей сравнила его результаты с известными данными о побочных эффектах и использовала другие методы проверки. Результат оказался впечатляюще точным, что дает надежду на то, что в будущем, по мере совершенствования алгоритма, его прогнозы смогут охватить более широкий круг препаратов и человеческих протеинов, поскольку на данный момент удалось исследовать воздействие на менее чем 1% из белков генома. Сегодня проект активно развивается и ученые со всего мира могут использовать, улучшать и развивать модель, которая бесплатно размещена в интернете.