Большие данные: рецепт для фармацевтических исследований и разработок
Опубликовано: 2022-03-11Цифры показывают, что 2016 год не был успешным для фармацевтической промышленности США. По состоянию на начало декабря Управление по санитарному надзору за качеством пищевых продуктов и медикаментов (FDA) одобрило только 19 новых лекарств, что составляет менее половины одобренных в 2015 г. и является самым низким показателем с 2007 г. Среди крупнейших игроков рентабельность инвестиций в исследования и разработки (НИОКР) упал до 3,7%.
Несмотря на эти обескураживающие статистические данные, фармацевтическая промышленность остается неотъемлемой частью более широкой экосистемы здравоохранения. Но отрасль сталкивается с растущим давлением в плане повышения производительности и сокращения времени разработки. Доходы от НИОКР служат важным показателем эффективности для инвесторов, а также отправной точкой для диалога между отраслью, плательщиками и группами по оценке медицинских технологий, которые в совокупности определяют ценность инновационных лекарств. Участники отрасли могут использовать различные стратегии, включая научное партнерство, инвестиции в развивающиеся рынки и диверсификацию продуктовых портфелей, для решения проблем с производительностью. Однако, как следует из этой статьи, другое решение включает в себя аналитику данных, которая может улучшить и ускорить разработку лекарств.
В этой статье рассматривается текущее состояние разработки лекарств и то, как большие данные могут улучшить различные ее компоненты: поиск лекарств, дизайн клинических испытаний и обнаружение побочных реакций на лекарства. Затем он завершится рекомендациями для компаний, желающих интегрировать эти типы решений.
Снижение рентабельности инвестиций в фармацевтические исследования и разработки
Как упоминалось ранее, лишь немногие лекарства-кандидаты в конечном итоге получают коммерческое одобрение, не говоря уже о коммерческом успехе. Только пять из 5000, или 0,1%, препаратов, которые проходят доклинические испытания, когда-либо доходят до испытаний на людях, и только одно становится одобренным для использования человеком.
Согласно отчету McKinsey за 2012 год, совокупные показатели успеха упали на 50%, поскольку количество программ разработки лекарств и стоимость каждой программы удвоились. Также широко распространено мнение, что разовые запуски показывают временное улучшение рентабельности инвестиций, затмевая более серьезные проблемы, такие как растущие затраты на пробные версии и переполненные рынки. Многие фармацевтические компании создали значительную акционерную стоимость за 25 лет, хотя их результаты в следующем десятилетии были более скромными (см. ниже).
Мало кто будет спорить с тем, что процесс разработки лекарств долгий и трудный. В конце концов, чтобы вывести лекарство на рынок, может потребоваться более 10 лет и 2,6 миллиарда долларов. Это начинается, когда исследователи пытаются понять процесс, стоящий за болезнью на клеточном или молекулярном уровне. Благодаря лучшему пониманию процессов и путей развития болезни определяются потенциальные «мишени» для новых методов лечения. Если доклинические испытания демонстрируют безопасность и эффективность, кандидат переходит к последовательным этапам тестирования, проверки и авторизации.
На каждом этапе решения о продвижении или остановке определенных соединений принимаются на основе экспериментальных и исторических данных. «Быстрая ошибка» или прекращение дальнейшей разработки из-за неудовлетворительной производительности имеет решающее значение. Это связано с тем, что затраты увеличиваются на каждом последующем этапе конвейера, особенно когда начинаются испытания на людях. Для борьбы с этими трудностями фармацевтические компании могут использовать аналитику данных.
Приложения для анализа данных для фармацевтических компаний
Аналитика больших данных включает в себя сбор, обработку и анализ массивных и разнообразных наборов данных. Это дает надежду фармацевтическим компаниям несколькими способами: 1) Предиктивное моделирование может выявить цели для разработки лекарств. 2) Статистические инструменты могут улучшить набор пациентов и улучшить мониторинг. 3) Интеллектуальный анализ данных общественных форумов и сайтов социальных сетей может выявить нежелательные реакции на лекарства, о которых официально не сообщается. Давайте углубимся в каждый вариант использования.
Прогнозное моделирование в поиске лекарств
Если бы вы были маркетинговой компанией, стремящейся оптимизировать конверсии, вы бы инвестировали ресурсы в свой целевой рынок, а не во все население. То же самое и с открытием новых лекарств: фармацевтические компании стремятся инвестировать в соединения, которые, вероятно, преуспеют в клинических испытаниях и на рынке, чтобы они могли окупить первоначальные инвестиции в исследования и разработки.
В прошлом исследователи использовали натуральные растительные или животные соединения в качестве основы для лекарств-кандидатов. Разработка лекарств исторически представляла собой повторяющийся процесс с использованием лабораторий высокопроизводительного скрининга (HTS) для физического тестирования тысяч соединений в день с ожидаемой частотой совпадений 1% или менее. Но теперь ученые создают новые молекулы с помощью компьютеров. Прогностическое моделирование, как сложное, так и базовое, может помочь предсказать взаимодействие, ингибирование и токсичность потенциальных лекарств. Распространенным методом является фармакокинетическое моделирование, в котором используются расширенные математические модели и симуляции для прогнозирования того, как соединение будет действовать в организме. Даже без доступной информации о структуре белка скрининг виртуальных библиотек соединений позволяет исследователям рассматривать до 10 000 соединений и сужать их до 10 или 20.
Эти возможности не обязательно должны создаваться внутри компании. Недавно IBM Watson Health и Pfizer установили партнерские отношения, чтобы помочь исследователям открывать новые мишени для лекарств. В то время как средний исследователь читает 250-300 статей в год, Watson обработал 25 миллионов рефератов Medline, более миллиона полнотекстовых статей в медицинских журналах и четыре миллиона патентов. Watson можно даже дополнить личными данными организации, чтобы выявить скрытые закономерности.
Более простой подход включает применение исторических данных доклинических исследований, клинических испытаний и постмаркетингового наблюдения. Данные можно использовать для прогнозирования конечного результата (одобрение FDA/исходы для пациентов) на основе различных независимых переменных.
Процессы, требующие больших объемов данных, способствуют расширению совместной работы
Платный доступ и патенты уже давно замедляют поток информации в гиперконкурентной отрасли. Таким образом, интересной тенденцией является растущее сотрудничество между отраслевыми сторонами. Например, некоммерческий консорциум Structural Genomics Consortium сотрудничает с девятью фармацевтическими компаниями и лабораториями, которые обязались делиться своими списками пожеланий к лекарствам, результатами в журналах с открытым доступом и экспериментальными образцами, чтобы ускорить открытие.
Точно так же британский стартап MedChemica находится в центре сотрудничества, призванного ускорить разработку с использованием интеллектуального анализа данных при сохранении интеллектуальной собственности каждого партнера. Технология MedChemica анализирует базы данных молекул партнеров, чтобы найти близко совпадающие пары, выполняет анализ между ними, а затем выходные данные используются для создания правил, которые можно применять к виртуальным молекулам для прогнозирования воздействия подобных структурных изменений. Все партнеры в консорциуме могут предложить, где необходимы дополнительные данные, и даже могут согласиться разделить расходы на дальнейшее тестирование.
Улучшенный дизайн клинических испытаний
Клинические испытания — это научные исследования, которые проверяют, является ли лечение безопасным и эффективным для людей. Есть три этапа, прежде чем лекарство перейдет на рассмотрение FDA. Каждая последующая фаза включает в себя больше людей, от десятков в фазе I до тысяч в фазе III. Процесс обычно занимает от шести до семи лет. Задержки с выходом на рынок могут составлять 15 миллионов долларов в день в виде альтернативных издержек для лекарства-блокбастера. Вот некоторые болевые точки клинических испытаний и то, как большие данные могут их облегчить:
Усовершенствованный целевой рекрутинг
Неудача испытаний часто вызвана неспособностью набрать достаточно подходящих пациентов. Испытания фазы III проводятся более чем в 100 центрах в десяти или более странах. А поскольку сейчас лекарства часто разрабатываются для нишевых групп населения, компании конкурируют за набор одних и тех же пациентов. В результате 37% клинических испытаний не достигают целей набора, а 11% центров не набирают ни одного пациента. По данным Национального института рака, только 5% больных раком участвуют в клинических испытаниях. Традиционным методом набора подходящих пациентов является ручная проверка списков пациентов врачей, но это дорого и медленно.
Вот где могут помочь электронные больничные данные о пациентах и большие данные. Благодаря аналитике и специалистам по данным пациенты могут быть зарегистрированы на основе других источников, а не посетителей врачей, таких как социальные сети. Критерии отбора пациентов теперь могут включать такие факторы, как генетическая информация, статус заболевания и индивидуальные характеристики, что позволяет проводить исследования меньше, короче и дешевле. «Это похоже на рыбалку с помощью эхолота», — сказал Джон Поттхофф, главный исполнительный директор Elligo Health Research. «Вы действительно можете видеть, где находятся пациенты и где их найти. Когда вы смотрите на более крупный пул, вы можете более целенаправленно находить пациентов, которые лучше всего соответствуют критериям включения и исключения». Эллен Келсо, исполнительный директор Chesapeake IRB, независимого институционального наблюдательного совета, который консультирует фармацевтические компании, считает, что более 60% испытаний используют предварительный онлайн-анализ для выявления потенциальных участников.

Более надежное и эффективное управление испытаниями
Автоматизация и большие данные позволяют отслеживать судебные процессы в режиме реального времени. Они могут идентифицировать сигналы безопасности или рабочие сигналы, помогая избежать дорогостоящих проблем, таких как неблагоприятные события и задержки. Согласно недавнему отчету McKinsey, потенциальное повышение эффективности клинических испытаний включает:
- Динамическая оценка размера выборки и другие изменения протокола могут позволить быстро реагировать на возникающие выводы из клинических данных. Они также позволяют проводить меньшие испытания с эквивалентной мощностью или более короткое время испытаний, что приводит к повышению эффективности.
- Адаптация к различиям в показателях набора пациентов на сайтах позволит компании решать проблемы с отстающими сайтами, при необходимости открывать новые сайты и увеличивать набор сотрудников с успешных сайтов.
- Использование электронных медицинских карт в качестве основного источника данных клинических испытаний вместо использования отдельной системы может ускорить испытания и уменьшить количество ошибок при ручном вводе данных.
- Удаленный мониторинг сайтов следующего поколения, обеспечиваемый доступом к данным в режиме реального времени, может улучшить управление и реагирование на проблемы, возникающие в ходе испытаний.
Дополнение данных клинических испытаний реальными данными
Отрасль пережила бурный рост доступных данных, помимо того, что было собрано в традиционных, строго контролируемых средах клинических испытаний. Хотя анонимные данные электронных медицинских карт (EHR) анализировались в прошлом, они обычно ограничиваются одним исследовательским учреждением или сетью поставщиков. Однако теперь можно связать различные источники данных, что позволяет решать сложные исследовательские вопросы.
Например, анализ данных EHR пациентов, собранных в режиме реального времени во время визитов к врачу или в больницу, может помочь нам лучше понять схемы лечения и клинические результаты в реальном мире. Эти данные дополняют данные, полученные в клинических испытаниях, и позволяют оценить более широкий спектр пациентов, обычно исключаемых из испытаний (например, пожилых, ослабленных или малоподвижных пациентов и т. д.). Фармацевтический гигант Genentech вложил значительные средства в этот подход, анализируя базы данных реальных пациентов, чтобы понять результаты различных подтипов пациентов, схемы лечения и то, как различные схемы лечения влияют на клинические результаты в реальном мире.
Обнаружение побочных реакций на лекарства
Вредные реакции, вызванные лекарствами, известны как побочные реакции на лекарства (НЛР). Поскольку клинические испытания не полностью имитируют реальные условия, последствия применения препарата не могут быть полностью оценены до выхода на рынок. Кроме того, системы отчетности о нежелательных реакциях основаны на спонтанных отчетах регулирующих органов, которые прошли через юристов, клиницистов и фармацевтов, где информация может быть утеряна или неверно истолкована. Таким образом, обнаружение нежелательных явлений и отчетность о них часто бывают неполными или несвоевременными. Подсчитано, что до 90% побочных эффектов препаратов не регистрируются.
Вместо этого многие потребители наркотиков обращаются к социальным сетям, таким как Twitter, Facebook, и общедоступным медицинским форумам, включая Medications.com и DailyStrength.com, чтобы озвучить жалобы или сообщить о побочных эффектах. Многие пользователи даже включают хэштеги регулирующих органов (например, #FDA), производителей (#Pfizer, #GSK) и конкретных продуктов (#accutaneprobz). Поиск на этих сайтах нежелательных реакций, предоставленных пациентами, может оказаться более точным, чем те, которые диагностируются медицинскими работниками. По словам Дэвида Льюиса, руководителя отдела глобальной безопасности Novartis, «извлечение данных из социальных сетей дает нам больше шансов выявить нежелательные реакции, на которые пациент не обязательно будет жаловаться своему врачу или медсестре… психиатр не может рассматривать суицидальные мысли как ADR, в то время как пациент может описать это в совершенстве». Также может быть выполнен анализ настроений, который с помощью вычислений идентифицирует и классифицирует мнения, выраженные в тексте.
Epidemico, дочерняя компания Booz Allen Hamilton, использует алгоритмы обработки естественного языка и машинного обучения для поиска ADR в сообщениях в социальных сетях для примерно 1400 лекарств. Исследование 2014 года, проведенное совместно FDA и Epidemico, изучило 6,9 миллиона сообщений в Twitter и выявило 4401 твит, который напоминал ADR. При сравнении с данными, хранящимися в FDA, исследование обнаружило высокую связь между неофициальными сообщениями в социальных сетях и сообщениями, полученными в ходе клинических испытаний (см. диаграмму ниже).
Рекомендации для фармацевтических компаний, желающих внедрить эти функции
Несмотря на его преимущества, многие фармацевтические компании опасаются инвестировать в аналитические возможности больших данных. Ниже приведены некоторые рекомендации для успешного внедрения:
Технологии и аналитика. Фармацевтические компании, использующие устаревшие системы, должны расширить возможности обмена данными, подключив эти системы. Кроме того, фармацевтические исследования и разработки должны использовать передовые инструменты, такие как биосенсоры и устройства для измерения состояния здоровья в смартфонах. Данные с интеллектуальных устройств и удаленный мониторинг пациентов с помощью датчиков и устройств могут облегчить исследования и разработки, проанализировать эффективность и увеличить продажи в будущем. Например, Google заключила партнерское соглашение с Novartis для разработки интеллектуальных контактных линз, которые отслеживают уровень глюкозы у диабетиков, а Roche и Qualcomm объединяют усилия для повышения уровня антикоагулянтных мониторов, защищающих от образования тромбов, для беспроводной передачи информации о пациентах.
Сосредоточьтесь на реальных доказательствах. Реальные результаты становятся все более важными, поскольку плательщики используют ценообразование, основанное на ценности. Компании могут выделиться, разрабатывая препараты с ощутимыми реальными результатами, например, те, которые нацелены на нишевые группы пациентов. Чтобы расширить свои данные за пределы клинических испытаний, они могут даже присоединиться к собственным сетям данных.
Сотрудничайте внутри и снаружи. Фармацевтические исследования и разработки исторически были засекречены, но как внутреннее, так и внешнее сотрудничество будет ключом к успеху в работе с большими данными. Улучшение внутреннего сотрудничества требует упорядоченного взаимодействия между исследованиями, клиническими разработками и медицинскими вопросами. Это может привести к пониманию всего портфолио, включая клиническую идентификацию и потенциальные возможности персонализированной медицины. Внешнее сотрудничество также важно: ученые-исследователи могут дать представление о последних научных достижениях, инициативы, возглавляемые другими фармацевтическими компаниями, могут создать более обширный и мощный пул данных, который можно использовать для открытий, а контрактные исследовательские организации (КИО) могут помочь масштабировать внутренние усилия. или предоставить конкретную экспертизу.
Организация. Чтобы избежать разрозненности данных и упростить обмен данными, лучше всего назначать владельцев для разных типов данных, чтобы их охват распространялся на разные функции. Опыт, полученный владельцем данных, будет иметь неоценимое значение при разработке способов использования существующей информации или интеграции дополнительных данных. Это также повысит ответственность за качество данных. Однако эти изменения возможны только в том случае, если руководство компании искренне поддерживает ценность больших данных.
Прощальные мысли
Сегодня очевидно, что науки о жизни, информатика и наука о данных сливаются воедино. Хотя технические и культурные проблемы, несомненно, ждут впереди, передовая аналитика данных — это рычаг, который фармацевтические компании могут использовать для борьбы с неблагоприятной экономикой НИОКР. Однако, конечно, перспективы больших данных так и останутся, если организации не предпримут стратегических шагов по внедрению.
По словам Глена де Вриса из SaaS-компании Medidata, большие данные «могут излечить болезни, связанные с исследованиями и разработками в сфере биологических наук». Во время Глобальной конференции по фармацевтике и биотехнологиям, организованной The Financial Times, он сравнил большие данные с открытием Розеттского камня, который позволил ученым расшифровать иероглифы и раскрыть историю Древнего Египта. Точно так же, если в системе здравоохранения можно будет объединить наборы данных, включая информацию, поступающую из геномики/протеомики, данные в клинике, записанные врачами, и мобильное здравоохранение, медицинские исследования претерпят революцию.