大數據:藥物研發困境的處方
已發表: 2022-03-11這些數字表明,2016 年對於美國製藥業來說並不是一個好年頭。 截至 12 月初,美國食品藥品監督管理局 (FDA) 僅批准了 19 種新藥,不到 2015 年批准的一半,是 2007 年以來的最低水平。在最大的參與者中,研發投資回報率(研發)下降到 3.7%。
儘管有這些令人沮喪的統計數據,製藥行業仍然是更廣泛的醫療保健生態系統不可或缺的一部分。 但該行業面臨著越來越大的壓力,需要提高生產力並縮短開發時間。 研發回報是投資者的一個重要績效指標,也是行業、支付方和衛生技術評估小組之間對話的起點,它們共同決定了創新藥物的價值。 行業參與者可以採取不同的策略——包括科學合作、對新興市場的投資以及產品組合的多樣化——來應對生產力問題。 然而,正如這篇文章所暗示的,另一個解決方案包括數據分析,它可以增強和加速藥物開發。
本文探討了藥物開發的現狀,以及大數據如何改進其不同組成部分:藥物發現、臨床試驗設計和藥物不良反應檢測。 然後,它將為希望整合這些類型的解決方案的公司提供建議。
降低藥物研發的投資回報率
如前所述,很少有候選藥物最終獲得商業批准,更不用說商業上的成功了。 在開始臨床前測試的藥物中,只有五分之五(或 0.1%)進入人體試驗,並且只有一種獲准用於人體。
根據麥肯錫 2012 年的一份報告,隨著藥物開發項目的數量和每個項目的成本翻倍,累積成功率下降了 50%。 人們還普遍認為,一次性發布顯示投資回報率的短暫改善,掩蓋了更深層次的問題,例如不斷增長的試驗成本和擁擠的市場。 許多製藥公司創造了可觀的 25 年股東價值,儘管它們在接下來的十年中的業績較為溫和(見下文)。
很少有人會質疑藥物開發過程漫長而艱鉅。 畢竟,將一種藥物推向市場可能需要 10 多年和 26 億美元。 當研究人員試圖在細胞或分子水平上了解疾病背後的過程時,它就開始了。 通過更好地了解疾病過程和途徑,可以確定新治療的潛在“目標”。 如果臨床前測試證明安全性和有效性,候選人將進入測試、審查和授權的連續階段。
在每一步,推進或停止某些化合物的決定都是根據實驗和歷史數據做出的。 “快速失敗”,或基於不令人滿意的性能終止進一步的開發,是至關重要的。 這是因為成本在管道的每個後續階段都會增加,尤其是在人體試驗開始時。 為了應對這些困難,製藥公司可以採用數據分析。
製藥公司的數據分析應用程序
大數據分析涉及對大量不同數據集的收集、操作和分析。 它以多種方式為製藥公司提供了希望:1) 預測建模可以挖掘藥物管道的目標。 2) 統計工具可以改善患者招募並加強監測。 3)公共論壇和社交媒體網站的數據挖掘可以識別未正式報告的藥物不良反應。 讓我們深入研究每個用例。
藥物發現中的預測建模
如果您是一家希望優化轉化的營銷公司,您會將資源投入到您的目標市場,而不是整個人群。 在藥物發現方面也是如此——製藥公司的目標是投資可能在臨床試驗和市場上取得成功的化合物,以便他們能夠收回最初的研發投資。
過去,研究人員使用天然植物或動物化合物作為候選藥物的基礎。 藥物開發歷來是一個迭代過程,使用高通量篩選 (HTS) 實驗室每天對數千種化合物進行物理測試,預期命中率為 1% 或更低。 但現在科學家們正在用計算機創造新的分子。 複雜和基本的預測模型可以幫助預測候選藥物的相互作用、抑制和毒性。 一種廣泛使用的方法是藥代動力學模型,它使用先進的數學模型和模擬來預測化合物在體內的作用。 即使沒有可用的蛋白質結構信息,虛擬化合物庫的篩選也允許研究人員考慮多達 10,000 種化合物,並將其縮小到 10 或 20 種。
這些功能不一定必須在內部構建。 最近,IBM Watson Health 和輝瑞公司建立了合作夥伴關係,以幫助研究人員發現新的藥物靶點。 雖然研究人員平均每年閱讀 250-300 篇文章,但 Watson 已經處理了 2500 萬篇 Medline 摘要、超過 100 萬篇全文醫學期刊文章和 400 萬篇專利。 Watson 甚至可以通過組織的私有數據來增強以揭示隱藏的模式。
一種更簡單的方法包括應用來自臨床前研究、臨床試驗和上市後監測的歷史數據。 該數據可用於基於各種獨立變量預測最終結果(FDA 批准/患者結果)。
需要大量數據的流程導致協作增加
付費牆和專利長期以來一直減緩競爭激烈的行業中的信息流動。 因此,一個有趣的趨勢是行業各方之間的合作不斷增加。 例如,非營利性結構基因組學聯盟與九家製藥公司和實驗室合作,他們承諾分享他們的藥物願望清單、開放獲取期刊的結果和實驗樣本,以加快發現速度。
同樣,英國初創公司 MedChemica 處於合作的核心,該合作旨在使用數據挖掘加速開發,同時維護每個合作夥伴的知識產權。 MedChemica 的技術挖掘合作夥伴的分子數據庫以找到緊密匹配的分子對,在兩者之間進行分析,然後將輸出用於創建可應用於虛擬分子的規則,以預測類似結構變化的影響。 聯盟中的所有合作夥伴都可以建議需要額外數據的地方,甚至可以同意分擔進一步測試的成本。
更好的臨床試驗設計
臨床試驗是測試治療對人類是否安全有效的研究。 在藥物進入 FDA 審查之前有三個階段。 隨後的每個階段都涉及更多的個人,從第一階段的數十人增加到第三階段的數千人。 該過程通常需要六到七年才能完成。 對於重磅藥物來說,上市延遲可能會導致每天 1500 萬美元的機會成本。 以下是一些臨床試驗痛點,以及大數據如何緩解這些痛點:
增強的、有針對性的招聘
試驗失敗通常是由於無法招募足夠的合格患者造成的。 III 期試驗在十個或更多國家的 100 多個地點進行。 而且,由於藥物現在通常是為特定人群設計的,因此公司競相招募相同的患者。 因此,37% 的臨床試驗未能達到招募目標,11% 的研究中心未能招募一名患者。 根據美國國家癌症研究所的數據,只有 5% 的癌症患者參加了臨床試驗。 招募符合條件的患者的傳統方法是人工審查醫生的患者名單——但它既昂貴又緩慢。

這就是電子患者醫院數據和大數據可以提供幫助的地方。 借助分析和數據科學家,患者可以根據醫生訪客以外的來源(如社交媒體)進行登記。 現在,患者選擇的標準可以包括遺傳信息、疾病狀態和個體特徵等因素,從而使試驗規模更小、時間更短、成本更低。 “這就像用探魚器釣魚,”Elligo Health Research 首席執行官 John Potthoff 說。 “你真的可以看到病人在哪里以及去哪裡接他們。 當您查看更大的池時,您可以更有針對性地找到最符合納入和排除標準的患者。” 為製藥公司提供諮詢的獨立機構審查委員會 Chesapeake IRB 的執行董事 Ellen Kelso 估計,超過 60% 的試驗使用初步在線分析來識別潛在參與者。
更強大、更高效的試驗管理
自動化和大數據允許實時監控試驗。 他們可以識別安全或操作信號,幫助避免不利事件和延誤等代價高昂的問題。 根據麥肯錫最近的一份報告,潛在的臨床試驗效率提升包括:
- 動態樣本量估計和其他協議更改可以快速響應來自臨床數據的新見解。 它們還可以實現同等功率的較小試驗或較短的試驗時間,從而提高效率。
- 適應站點患者招募率的差異將使公司能夠解決滯後的站點,在必要時將新站點上線,並增加從成功站點的招聘。
- 使用電子病歷作為臨床試驗數據的主要來源而不是使用單獨的系統可以加速試驗並減少手動數據輸入錯誤。
- 通過實時數據訪問實現的下一代站點遠程監控可以改善對試驗中出現的問題的管理和響應。
用真實世界數據補充臨床試驗數據
該行業經歷了可用數據的爆炸式增長,超出了從傳統、嚴格控制的臨床試驗環境中收集到的數據。 雖然過去曾分析過匿名電子健康記錄 (EHR) 數據,但它通常僅限於單個研究機構或提供商網絡。 但是,現在可以鏈接不同的數據源,從而解決複雜的研究問題。
例如,分析在醫生或醫院就診期間實時收集的 EHR 患者數據可以幫助我們更好地了解現實世界中的治療模式和臨床結果。 這些見解補充了從臨床試驗中獲得的見解,並且可以評估通常被排除在試驗之外的更廣泛的患者(例如,老年、體弱或行動不便的患者等)。 製藥巨頭基因泰克在這種方法上投入巨資,分析現實世界患者的數據庫,以了解不同患者亞型、治療方案的結果,以及不同治療模式如何影響現實世界中的臨床結果。
藥物不良反應檢測
藥物引起的有害反應稱為藥物不良反應(ADR)。 由於臨床試驗不能完全模擬真實世界的條件,因此無法在上市前全面評估藥物的後果。 而且,ADR 報告系統依賴於通過律師、臨床醫生和藥劑師的自發監管報告,其中信息可能會丟失或被誤解。 因此,ADR 檢測和報告往往不完整或不及時。 據估計,高達 90% 的藥物副作用未被報導。
許多吸毒者轉而使用 Twitter、Facebook 等社交媒體和包括 Medications.com 和 DailyStrength.com 在內的公共醫療論壇來表達投訴或報告副作用。 許多用戶甚至包括監管機構(例如#FDA)、製造商(#Pfizer、#GSK)和特定產品(#accutaneprobz)的標籤。 為患者提供的 ADR 挖掘這些站點可以證明比醫療專業人員診斷的那些站點更準確。 諾華公司全球安全負責人大衛劉易斯表示,“從社交媒體中挖掘數據使我們有更大的機會捕獲患者不一定會向醫生或護士抱怨的 ADR……精神科醫生不能將自殺意念視為一個 ADR,而患者可以完美地描述它。” 還可以執行情感分析,它通過計算識別和分類文本中表達的觀點。
博思艾倫漢密爾頓的子公司 Epidemico 使用自然語言處理和機器學習算法從社交媒體帖子中搜索大約 1,400 種藥物的 ADR。 由 FDA 和 Epidemico 聯合發起的一項 2014 年研究檢查了 690 萬條推特帖子,發現了 4,401 條類似於 ADR 的推文。 與 FDA 持有的數據相比,該研究發現非正式社交媒體報告與臨床試驗報告之間存在高度相關性(見下表)。
對希望實施這些功能的製藥公司的建議
儘管有好處,但許多製藥公司對投資大數據分析能力持謹慎態度。 以下是一些成功實施的建議:
技術和分析。 利用遺留系統的製藥公司應該通過連接這些系統來提高共享數據的能力。 此外,製藥研發應利用智能手機中的生物傳感器和健康測量設備等尖端工具。 來自智能設備的數據以及通過傳感器和設備對患者進行遠程監控可以促進研發、分析療效並提高未來的銷售量。 例如,谷歌與諾華達成合作,開發一種智能隱形眼鏡,監測糖尿病患者的血糖水平,而羅氏和高通正在聯手提升抗凝監測儀,以無線傳輸患者信息。
專注於現實世界的證據。 隨著付款人使用基於價值的定價,現實世界的結果變得越來越重要。 公司可以通過追求具有切實現實結果的藥物來使自己與眾不同,例如針對特定患者群體的藥物。 為了將他們的數據擴展到臨床試驗之外,他們甚至可以加入專有數據網絡。
內部和外部合作。 製藥研發歷來是保密的,但內部和外部合作將是大數據成功的關鍵。 改善內部協作需要簡化發現、臨床開發和醫療事務之間的溝通。 這可以帶來整個產品組合的洞察力,包括臨床識別和個性化醫療的潛在機會。 外部合作也很重要:學術研究人員可以提供對最新科學突破的洞察,與其他製藥公司牽頭的計劃可以創建一個更大、更強大的數據池以用於發現,合同研究組織 (CRO) 可以幫助擴大內部工作或提供特定的專業知識。
組織。 為避免數據孤島並促進數據共享,最好將所有者分配給不同的數據類型,使其範圍擴展到跨職能。 在開發使用現有信息或集成其他數據的方法時,數據所有者獲得的專業知識將非常寶貴。 它還將加強對數據質量的問責。 然而,只有當公司領導層真正支持大數據的價值時,這些變化才有可能。
離別的思念
今天,很明顯,生命科學、計算機科學和數據科學正在融合。 儘管技術和文化挑戰無疑擺在面前,但先進的數據分析是製藥公司可以用來對抗不利的研發經濟的槓桿。 當然,如果組織不採取戰略性措施來實施,大數據的前景將依然存在。
SaaS 公司 Medidata 的 Glen de Vries 表示,大數據“可以治愈生命科學的研發困境”。 在英國《金融時報》主辦的全球製藥和生物技術會議上,他將大數據與羅塞塔石碑的發現進行了比較,羅塞塔石碑讓學者們能夠破譯象形文字並解開古埃及的歷史。 同樣,如果數據集可以在醫療保健系統中結合,包括來自基因組學/蛋白質組學的信息、醫生記錄的臨床數據和移動健康,醫學研究將發生一場革命。