大数据:药物研发困境的处方
已发表: 2022-03-11这些数字表明,2016 年对于美国制药业来说并不是一个好年头。 截至 12 月初,美国食品药品监督管理局 (FDA) 仅批准了 19 种新药,不到 2015 年批准的一半,是 2007 年以来的最低水平。在最大的参与者中,研发投资回报率(研发)下降到 3.7%。
尽管有这些令人沮丧的统计数据,制药行业仍然是更广泛的医疗保健生态系统不可或缺的一部分。 但该行业面临着越来越大的压力,需要提高生产力并缩短开发时间。 研发回报是投资者的一项重要绩效指标,也是行业、支付方和卫生技术评估小组之间对话的起点,它们共同决定了创新药物的价值。 行业参与者可以采取不同的策略——包括科学合作、对新兴市场的投资以及产品组合的多样化——来应对生产力问题。 然而,正如这篇文章所暗示的,另一个解决方案包括数据分析,它可以增强和加速药物开发。
本文探讨了药物开发的现状,以及大数据如何改进其不同组成部分:药物发现、临床试验设计和药物不良反应检测。 然后,它将为希望整合这些类型的解决方案的公司提供建议。
降低药物研发的投资回报率
如前所述,很少有候选药物最终获得商业批准,更不用说商业上的成功了。 在开始临床前测试的药物中,只有五分之五(或 0.1%)进入人体试验,并且只有一种获准用于人体。
根据麦肯锡 2012 年的一份报告,随着药物开发项目的数量和每个项目的成本翻倍,累积成功率下降了 50%。 人们还普遍认为,一次性发布显示投资回报率的短暂改善,掩盖了更深层次的问题,例如不断增长的试验成本和拥挤的市场。 许多制药公司创造了可观的 25 年股东价值,尽管它们在接下来的十年中的业绩较为温和(见下文)。
很少有人会质疑药物开发过程漫长而艰巨。 毕竟,将一种药物推向市场可能需要 10 多年和 26 亿美元。 当研究人员试图在细胞或分子水平上了解疾病背后的过程时,它就开始了。 通过更好地了解疾病过程和途径,可以确定新治疗的潜在“目标”。 如果临床前测试证明安全性和有效性,候选人将进入测试、审查和授权的连续阶段。
在每一步,推进或停止某些化合物的决定都是根据实验和历史数据做出的。 “快速失败”,或基于不令人满意的性能终止进一步的开发,是至关重要的。 这是因为成本在管道的每个后续阶段都会增加,尤其是在人体试验开始时。 为了应对这些困难,制药公司可以采用数据分析。
制药公司的数据分析应用程序
大数据分析涉及对大量不同数据集的收集、操作和分析。 它以多种方式为制药公司提供了希望:1) 预测建模可以挖掘药物管道的目标。 2) 统计工具可以改善患者招募并加强监测。 3)公共论坛和社交媒体网站的数据挖掘可以识别未正式报告的药物不良反应。 让我们深入研究每个用例。
药物发现中的预测建模
如果您是一家希望优化转化的营销公司,您会将资源投入到您的目标市场,而不是整个人群。 在药物发现方面也是如此——制药公司的目标是投资可能在临床试验和市场上取得成功的化合物,以便他们能够收回最初的研发投资。
过去,研究人员使用天然植物或动物化合物作为候选药物的基础。 药物开发历来是一个迭代过程,使用高通量筛选 (HTS) 实验室每天对数千种化合物进行物理测试,预期命中率为 1% 或更低。 但现在科学家们正在用计算机创造新的分子。 复杂和基本的预测模型可以帮助预测候选药物的相互作用、抑制和毒性。 一种广泛使用的方法是药代动力学模型,它使用先进的数学模型和模拟来预测化合物在体内的作用。 即使没有可用的蛋白质结构信息,虚拟化合物库的筛选也允许研究人员考虑多达 10,000 种化合物,并将其缩小到 10 或 20 种。
这些功能不一定必须在内部构建。 最近,IBM Watson Health 和辉瑞公司建立了合作伙伴关系,以帮助研究人员发现新的药物靶点。 虽然研究人员平均每年阅读 250-300 篇文章,但 Watson 已经处理了 2500 万篇 Medline 摘要、超过 100 万篇全文医学期刊文章和 400 万篇专利。 Watson 甚至可以通过组织的私有数据来增强以揭示隐藏的模式。
一种更简单的方法包括应用来自临床前研究、临床试验和上市后监测的历史数据。 该数据可用于基于各种独立变量预测最终结果(FDA 批准/患者结果)。
需要大量数据的流程导致协作增加
付费墙和专利长期以来一直减缓竞争激烈的行业中的信息流动。 因此,一个有趣的趋势是行业各方之间的合作不断增加。 例如,非营利性结构基因组学联盟与九家制药公司和实验室合作,他们承诺分享他们的药物愿望清单、开放获取期刊的结果和实验样本,以加快发现速度。
同样,英国初创公司 MedChemica 处于合作的核心,该合作旨在使用数据挖掘加速开发,同时维护每个合作伙伴的知识产权。 MedChemica 的技术挖掘合作伙伴的分子数据库以找到紧密匹配的分子对,在两者之间进行分析,然后将输出用于创建可应用于虚拟分子的规则,以预测类似结构变化的影响。 联盟中的所有合作伙伴都可以建议需要额外数据的地方,甚至可以同意分担进一步测试的成本。
更好的临床试验设计
临床试验是测试治疗对人类是否安全有效的研究。 在药物进入 FDA 审查之前有三个阶段。 随后的每个阶段都涉及更多的个人,从第一阶段的数十人增加到第三阶段的数千人。 该过程通常需要六到七年才能完成。 对于重磅药物来说,上市延迟可能会导致每天 1500 万美元的机会成本。 以下是一些临床试验痛点,以及大数据如何缓解这些痛点:
增强的、有针对性的招聘
试验失败通常是由于无法招募足够的合格患者造成的。 III 期试验在十个或更多国家的 100 多个地点进行。 而且,由于药物现在通常是为特定人群设计的,因此公司竞相招募相同的患者。 因此,37% 的临床试验未能达到招募目标,11% 的研究中心未能招募一名患者。 根据美国国家癌症研究所的数据,只有 5% 的癌症患者参加了临床试验。 招募符合条件的患者的传统方法是人工审查医生的患者名单——但它既昂贵又缓慢。

这就是电子患者医院数据和大数据可以提供帮助的地方。 借助分析和数据科学家,患者可以根据医生访客以外的来源(如社交媒体)进行登记。 现在,患者选择的标准可以包括遗传信息、疾病状态和个体特征等因素,从而使试验规模更小、时间更短、成本更低。 “这就像用探鱼器钓鱼,”Elligo Health Research 首席执行官 John Potthoff 说。 “你真的可以看到病人在哪里以及去哪里接他们。 当您查看更大的池时,您可以更有针对性地找到最符合纳入和排除标准的患者。” 为制药公司提供咨询的独立机构审查委员会 Chesapeake IRB 的执行董事 Ellen Kelso 估计,超过 60% 的试验使用初步在线分析来识别潜在参与者。
更强大、更高效的试验管理
自动化和大数据允许实时监控试验。 他们可以识别安全或操作信号,帮助避免不利事件和延误等代价高昂的问题。 根据麦肯锡最近的一份报告,潜在的临床试验效率提升包括:
- 动态样本量估计和其他协议更改可以快速响应来自临床数据的新见解。 它们还可以实现同等功率的较小试验或较短的试验时间,从而提高效率。
- 适应站点患者招募率的差异将使公司能够解决滞后的站点,在必要时将新站点上线,并增加从成功站点的招聘。
- 使用电子病历作为临床试验数据的主要来源而不是使用单独的系统可以加速试验并减少手动数据输入错误。
- 通过实时数据访问实现的下一代站点远程监控可以改善对试验中出现的问题的管理和响应。
用真实世界数据补充临床试验数据
该行业经历了可用数据的爆炸式增长,超出了从传统、严格控制的临床试验环境中收集到的数据。 虽然过去曾分析过匿名电子健康记录 (EHR) 数据,但它通常仅限于单个研究机构或提供商网络。 但是,现在可以链接不同的数据源,从而解决复杂的研究问题。
例如,分析在医生或医院就诊期间实时收集的 EHR 患者数据可以帮助我们更好地了解现实世界中的治疗模式和临床结果。 这些见解补充了从临床试验中获得的见解,并且可以评估通常被排除在试验之外的更广泛的患者(例如,老年、体弱或行动不便的患者等)。 制药巨头基因泰克在这种方法上投入巨资,分析现实世界患者的数据库,以了解不同患者亚型、治疗方案的结果,以及不同治疗模式如何影响现实世界中的临床结果。
药物不良反应检测
药物引起的有害反应称为药物不良反应(ADR)。 由于临床试验不能完全模拟真实世界的条件,因此无法在上市前全面评估药物的后果。 而且,ADR 报告系统依赖于通过律师、临床医生和药剂师的自发监管报告,其中信息可能会丢失或被误解。 因此,ADR 检测和报告往往不完整或不及时。 据估计,高达 90% 的药物副作用未被报道。
许多吸毒者转而使用 Twitter、Facebook 等社交媒体和包括 Medications.com 和 DailyStrength.com 在内的公共医疗论坛来表达投诉或报告副作用。 许多用户甚至包括监管机构(例如#FDA)、制造商(#Pfizer、#GSK)和特定产品(#accutaneprobz)的标签。 为患者提供的 ADR 挖掘这些站点可以证明比医疗专业人员诊断的那些站点更准确。 诺华全球安全负责人大卫刘易斯表示,“从社交媒体中挖掘数据使我们更有机会捕获患者不一定会向医生或护士抱怨的 ADR……精神科医生不能将自杀意念视为一个 ADR,而患者可以完美地描述它。” 还可以执行情感分析,它通过计算识别和分类文本中表达的观点。
博思艾伦汉密尔顿的子公司 Epidemico 使用自然语言处理和机器学习算法从社交媒体帖子中搜索大约 1,400 种药物的 ADR。 由 FDA 和 Epidemico 联合发起的一项 2014 年研究检查了 690 万条推特帖子,发现了 4,401 条类似于 ADR 的推文。 与 FDA 持有的数据相比,该研究发现非正式社交媒体报告与临床试验报告之间存在高度相关性(见下表)。
对希望实施这些功能的制药公司的建议
尽管有好处,但许多制药公司对投资大数据分析能力持谨慎态度。 以下是一些成功实施的建议:
技术和分析。 利用遗留系统的制药公司应该通过连接这些系统来提高共享数据的能力。 此外,制药研发应利用智能手机中的生物传感器和健康测量设备等尖端工具。 来自智能设备的数据以及通过传感器和设备对患者进行远程监控可以促进研发、分析疗效并提高未来的销售量。 例如,谷歌与诺华达成合作,开发一种智能隐形眼镜,监测糖尿病患者的血糖水平,而罗氏和高通正在联手提升抗凝监测仪,以无线传输患者信息。
专注于现实世界的证据。 随着付款人使用基于价值的定价,现实世界的结果变得越来越重要。 公司可以通过追求具有切实现实结果的药物来使自己与众不同,例如针对特定患者群体的药物。 为了将他们的数据扩展到临床试验之外,他们甚至可以加入专有数据网络。
内部和外部合作。 制药研发历来是保密的,但内部和外部合作将是大数据成功的关键。 改善内部协作需要简化发现、临床开发和医疗事务之间的沟通。 这可以带来整个产品组合的洞察力,包括临床识别和个性化医疗的潜在机会。 外部合作也很重要:学术研究人员可以提供对最新科学突破的洞察,与其他制药公司牵头的计划可以创建一个更大、更强大的数据池以用于发现,合同研究组织 (CRO) 可以帮助扩大内部工作或提供特定的专业知识。
组织。 为避免数据孤岛并促进数据共享,最好将所有者分配给不同的数据类型,使其范围扩展到跨职能。 在开发使用现有信息或集成其他数据的方法时,数据所有者获得的专业知识将非常宝贵。 它还将加强对数据质量的问责。 然而,只有当公司领导层真正支持大数据的价值时,这些变化才有可能。
离别的思念
今天,很明显,生命科学、计算机科学和数据科学正在融合。 尽管技术和文化挑战无疑摆在面前,但先进的数据分析是制药公司可以用来对抗不利的研发经济的杠杆。 当然,如果组织不采取战略性措施来实施,大数据的前景将依然存在。
SaaS 公司 Medidata 的 Glen de Vries 表示,大数据“可以治愈生命科学的研发困境”。 在英国《金融时报》主办的全球制药和生物技术会议上,他将大数据与罗塞塔石碑的发现进行了比较,罗塞塔石碑让学者们能够破译象形文字并解开古埃及的历史。 同样,如果数据集可以在医疗保健系统中结合,包括来自基因组学/蛋白质组学的信息、医生记录的临床数据和移动健康,医学研究将发生一场革命。