从上世纪80年代起,美国食品药品监督管理局(FDA)等监管部门就将临床研究数据作为审批决策的关键依据。这一做法提高了监管决策的科学性,同时也导致新药研发成本显著增加,其中受试者相关费用、研究人力和时间投入是费用增加的主要因素。据部分医药上市公司披露的财报数据推算,在国际多中心临床研究(MRCT)中,入组一例受试者完成研究平均成本约10到20万美元,此外人力成本占研发总费用超过50%。
而引入数字化,有利于从整体上提升新药研发效率,缩短研发周期,控制成本花费,从而降低药品价格,提升患者的用药可及性和可负担性。“数字化创新是底层技术革命,将重构新药研发生态,并深刻影响制药领域的发展和竞争格局。”百济神州高级副总裁、统计和数据科学全球负责人郭翔博士表示。
郭翔始终记得2017年入职时,百济神州联合创始人、董事长兼首席执行官欧雷强(John V. Oyler)与他的一段谈话:“就像过去二十年许多行业发生过的那样,中国一定也会出现世界排名前十甚至前五的制药公司,不一定是百济神州,但如果我们努力了,机会就在那里。”郭翔说,促使他离开默沙东加入百济神州的重要原因之一,是欧雷强和全球研发负责人汪来博士等公司高层,对数据科学在新药研发中的作用高度认可。
郭翔认为,目前百济神州参与研发数字创新的时机和体量刚好,既有能力提供必要的资源,又没有沉重的历史包袱,是难得的机遇。“我们正在创建软、硬件结合的数字技术平台。未来,数据科学将帮助新药临床研究,更精准评估药物的疗效和安全性;同时实现数据与决策者无缝对接,协助决策者快速筛选处理信息,提高决策质量;此外,自动化系统和一体化数字研发平台将显著提高运营效率,并通过数据积累和用户反馈为机器学习和人工智能打下关键基础,促进药物研发更加现代化。”
统计创新把控临床研究风险
临床试验结束时,在药企提交给监管机构的成百上千页报告中,对成败起决定性作用的是主要疗效指标的估计值和相应假设检验的P值。因此,在数字创新大背景下,百济神州统计和数据科学部首先将统计方法创新应用于协助临床研究更好把握P值及疗效估计。
最近,百济神州的泽布替尼在全球Ⅲ期ALPINE试验中获得令人振奋的结果:在复发/难治性慢性淋巴细胞白血病/小淋巴细胞淋巴瘤患者中“头对头”比较伊布替尼,达到无进展生存期(PFS)优效性结果。
“ ‘头对头’临床试验要求数据科学团队对试验结果有更强的把控能力。这类试验需要在启动前合理设置试验终点和试验假设。”郭翔提到,一方面假设两组数据的差值不能太小,数字要有临床意义;但也不能太大,若试验组和对照组实际疗效的差异是20%,而试验假设两者差异30%,最终试验P值就可能大于0.05,无法达到统计学优效性结果。
郭翔博士参加百济神州产品新适应症获批内部活动。
当下新药研发竞争愈发激烈,企业为抢占市场先机,节省研发时间及降低研发成本,临床研究方案设计还在不断创新,但新设计往往也会增加研究的不确定性,并给随机化、偏倚控制等增加难度。郭翔说:“这对申办方的技术手段和风险把控能力提出了更高的要求,需要数据科学创新来担任临床研究风险把控的守门员。”
他举了一些例子,例如在多项已经结束和正在进行的临床试验中,为加快研发速度,在缺少Ⅱ期试验结果或Ⅱ期试验尚未结束时,就启动Ⅲ期试验。“对于新靶点产品,此时除内部研究数据外,可为Ⅲ期研究的假设和终点设置提供参考的外部数据并不丰富,临床试验就面临更大的不确定性风险。”
为此,百济神州统计和数据科学团队和临床团队合作,在多项试验中采用适应性设计。
“我们增加了中期无效检验,一旦有可靠证据表明药物未达理想治疗效果,可及时终止试验保护受试者利益;另外,在试验设计中加入预设方案调整的内容,可以在试验进行中根据内部Ⅱ期试验结果或者外部数据发布,变更试验假设或调整样本量等。”郭翔说。
此外,对于新型试验设计可能增加试验结果假阳性几率或引入更多偏倚,申办方在采用新型试验设计时,还须向监管部门证明新设计不会增加在无效药物上观测到有效结果的可能性。
百济神州在技术方面提前布局,统计部门内部于2021年建立方法学(Methodology)研究团队,应用模拟研究和理论推导等统计方法,验证新型试验设计在假阳性控制和偏倚控制上的合理性。
例如,团队利用模拟研究推演一项适应性设计临床试验,在药物无效假设下,多次重复模拟试验,取得阳性结果的概率会小于药监机构设定的5%的阈值。“这样的研究可以让监管部门对批准更有信心,但模拟研究设计过程非常复杂,需要考虑大量的影响因素,”郭翔说,“有时递交给监管部门的模拟研究报告,其篇幅甚至与一个小型临床研究报告相当。”
近年,百济神州统计和数据科学部为了支持新型研究开展,大量引进国内外具有丰富药物研发和监管经验的数据科学人才。例如,统计负责人田红博士在加入百济神州前,曾任强生公司肿瘤药早期研发统计负责人;数据科学领导者叶京晶博士,曾是FDA生物统计部门审评项目负责人,领导过包括泽布替尼在内多款新药上市的统计审评工作;统计方法学团队负责人陆开风博士曾就职于默沙东、艾伯维等公司,其在统计理论研究方面能力出色。
田红
叶京晶
陆开风
“他们过往的丰富经验可为新研究设计的风险和偏倚控制提供洞见。有些问题实际解决起来非常有挑战,需要大量经验和技术手段积累。”郭翔说,具有国际视野的顶尖数据科学人才加入,使百济神州有足够胆量采用新型研究设计加速产品临床开发。
让数据与决策者无缝对接
在统计团队日趋成熟下,最近两年郭翔开始把更多精力投入百济神州数据仓库(Data Warehouse)和数字化建设。其部门下属的数据科学团队亦专门负责此项工作推进,这部分人员最近一年正快速增加。
数据仓库项目将对百济神州的跨部门数据进行整合,其中包括临床试验数据、临床运营数据、临床生物标志物数据,以及上市后的安全性数据和真实世界数据等,未来还将进一步整合临床前研究和其他相关数据。在郭翔的规划中,数据仓库有望成为未来实现创新药研发数字化、可视化、自动化和人工智能的关键基础设施建设。
郭翔博士在2021DIA中国药物研发定量科学论坛上发言。
“数据仓库作为一体化数字平台的基础,就像图书馆的图书管理系统,使用者可迅速了解仓库里有哪些数据,以及他需要的数据在哪里、是什么样的属性。”郭翔说,“我们会根据不同部门的业务需求,打造数据可视化看板(Dashboard),采用更直观的方式如多种图表展示等,让决策者能更完整、更快速且高质量地获取需要的信息。”
药物研发进入信息大爆炸时代,决策者很难再像十年、二十年前那样,凭借自身记忆能力,掌握全球几十甚至几百个在研同类竞争项目的信息和各项数据。他提到,数据仓库未来可通过整合爬虫、搜索和自然语言处理等技术,即时抓取关键竞争项目的研究设计、数据更新,以及市场信息变化等,并将其推送给决策者。
“临床研发团队可以基于这些数据和关键信息,制定研发策略,并在策略执行中也获得可能的信息更新,快速调整研发计划。” 郭翔说。
整合数据的过程中,郭翔强调数据科学部门要不断与业务部门对接,帮助业务团队利用数字创新提升决策质量和运营效率。“这是提高各部门参与数字化建设积极性的关键。数字创新不是空中楼阁,不能演变成为用户的负担,而是要力争为不同部门解决实际问题。”
首先,数字化决策可为临床研究节省运营成本。临床研究需要采购试验药品,但此前药品用量的估计方法较为粗略,只是根据各研究中心预期入组的患者数大致计算。而实际研究中,每位患者的用药量、用药时间不同,患者入组时间也或早或晚,有些患者还会提前退出研究。因此,粗略估计的用药量经常与实际有较大出入,造成药品浪费等问题。
通过数据整合,数据科学团队利用收集到的数据,开发出可动态预测临床研究试验药品用量的临床药物采购管理工具。
“我们会根据临床试验的患者入组速度、用药情况、不良事件或退出情况等数据,动态测算药品的采购需求。就像一个蓄水池,随时监测水的进出情况,使其保持动态平衡。研发中的工具将来在一体化的平台上还可以根据方案变更、试验假设变更实时触发药物采购需求变更。”郭翔说,“临床研究中试验药品采购是一项主要支出,‘头对头’研究中对照药尤其昂贵,数字化能够提升用药量预测精准度,节省研究开支。”
其次,数字化决策可提高临床研究运营效率。数据仓库中涵盖部分真实世界数据,通过分析和利用这些数据,可加快研究项目受试者入组。“通过数据对比,我们能提前了解过往临床试验中,哪些研究中心在同样适应症和人群范围内入组了较多患者,且执行质量较高,这样就可以优先选择这些中心开展研究,让试验患者入组更加高效。”郭翔说,“基于我们提供的数据,临床执行团队能更有针对性地开展工作。”
类似的数字化也可用于提升临床研究监察效率。系统可对数据实时监控,及时发现数据存在的异常值,并通过比较不同中心间的数据差异,对某一中心数据明显偏离正常值提出预警。“研究过程中收集到的每个数据都会对最终的P值产生影响,因此及时发现数据异常,并反馈给运营团队,这非常必要。”郭翔提到,目前药监部门也在推广基于风险的试验监察(RBM,Risk Based Monitoring),但这只有建立在数字化决策系统的基础上,才能更好实现。
自动化为智能做药打下基础
百济神州的数字化创新还有一项重要工作,即推进临床运营自动化,将研究人员从繁琐工作中解放出来,同时利用用户在使用中反馈的信息,为机器学习和人工智能打下基础。
据郭翔介绍,百济神州业务团队始终追求流程创新,以期不断提高工作效率。他举例:一项Ⅲ期临床试验,从数据库锁库到完成临床试验报告(CSR)的图表绘制,过去大约需要4——6周时间,而公司团队目前已将时间减少到2——3周。“该目标是在流程改善和新技术支持下完成的,而不是依靠无限增加人力投入,其中自动化发挥了巨大作用。”
郭翔博士参加百济神州内部活动。
在百济神州建设中的一体化数字研发平台,类似的自动化流程还将被应用于研究方案撰写和临床试验电子数据采集系统(EDC)设计等。机器可以根据输入的关键词,自动设计出研究方案初版。例如,输入关键词“非小细胞肺癌新辅助治疗”,系统能对数据仓库储存的信息,以及从各公开渠道抓取的类似研究方案,自动进行解析并产生第一版方案。公司的临床研究方案设计者,只需在机器提供的版本上作细节修改。
自动化系统还会不断接收反馈——用户在研究方案上进行的每一次修改和修改的原因等,都会被作为数据记录下来,用于帮助提升自动化系统的工作水平,让它变得越来越精准。这将有望进一步提高百济神州的临床运营效率和决策质量,也有助于探索发现适用于新药研发领域的人工智能新规则。
郭翔认为,人工智能用于全新药物开发的设想,其实现过程不会一蹴而就,而是需要持续创新并夯实底层技术和数据积累,让人工智能在制药行业中被进一步历练,未来才可能被直接应用于新药发现。
“人工智能在下围棋等规则清晰、维度有限的领域内,应用已十分成熟。但人类自身对开发新药的规则了解有限,我们无法把筛选新药的规则完整告诉机器,新药研发也不允许人工智能利用患者试错。购物网站可以仅仅根据购买行为关联性把尿布和啤酒打包推荐给消费者,并在之后的消费者购买行为中验证其中的因果性。但新药研发公司不可能随便将两个不同靶点肿瘤药的随机组合推荐给患者,试图通过患者的治疗反馈来优化推荐系统。”因此,郭翔认为,当下机器学习等人工智能如果要在新药研发中发挥作用的话,可能还需要我们在理论和技术上实现更大的突破。
“人工智能进入新药研发领域需要寻找新的切入点。在百济神州,实现临床运营自动化和为决策者提供更好的数据支持可以作为潜在的切入点。对于制药而言,这样的切入点也符合行业需求,缩短研发时间,加快受试者入组,减少研发人员投入,这些工作均有利于提升新药研发效率。”郭翔说,产品进入商业化阶段的速度越快,公司就能愈早实现收入增加。而降低研发成本,新药就有机会以更优的价格惠及更多发展中国家患者,这本身也是百济神州的全球化目标。
“我期待百济神州能真正实现数字技术和药物创新的基因融合,做到让数据随时随地呈现在决策者面前的同时,利用他们的反馈推动新药研发数字化思维创新和技术突破。凭借在统计和数据科学领域的探索,百济神州有望成为新药研发数字化在全球范围内的开拓者和引领者。”对于未来,郭翔雄心勃勃。