使用高级分析大规模生成真实世界的证据

2023-07-01 0 808

使用高级分析大规模生成真实世界的证据

生成真实世界证据 (RWE) 的先进技术可帮助制药公司提供可改变患者治疗结果的见解,并创造重大价值。 麦肯锡估计,在未来三到五年内,通过在其价值链中采用先进的 RWE 分析,排名前 20 的制药公司平均每年可以释放超过 3 亿美元的收入。

由于分析方法的进步以及对丰富的 RWE 数据源的访问不断增加,改善患者治疗结果的机会正在激增。 制药公司可以收集数亿条具有近实时数据的记录,并将其部署到基于使用和结果的研究以及与利益相关者的风险分担协议中。 然而,尽管前景光明,许多制药公司仍然难以有效部署高级分析 (AA) 来生成 RWE。 在本文中,我们将探讨如何建立成功的分析团队、选择可增加价值的用例以及构建技术平台来支持 AA 应用程序(从早期工作到大规模部署)。

创建具有 AA 专业知识的跨学科 RWE 团队
从历史上看,RWE 部门聘用了具有生物统计学、卫生政策、临床医学和流行病学(包括药物流行病学)专业知识的专业人员。 这些专家通过使用经典的描述性和统计分析方法从现实世界数据(RWD)中提取价值。 为了将高级分析添加到方法论工具箱中,制药公司必须做出两项关键的组织和文化变革:创建具有四个学科专业知识的团队,并努力结合不同分析文化的优势。

团队组成
为了大规模提供 RWE 分析,团队需要来自四个不同学科的专家。

临床专家就用例的设计以及要考虑的患者或治疗类型提供医学意见。 通过考虑临床实践和患者访问问题,它们还可以帮助解释数据模式。 当项目结束时,他们帮助组织了解结果的医学合理性。

具有流行病学和健康结果或生物统计学背景的方法专家确保分析方法和个体因果发现的统计准确性的标准足够高。 具有这种背景的人经常扮演并且可以继续扮演翻译者的角色(见下文),负责确保公司间在研究方案和主要感兴趣结果的验证方面保持一致。

翻译人员充当业务利益相关者与临床和技术团队之间的中间人。 他们负责将业务和医疗要求转化为技术团队的指令,并以可集成到业务策略或流程中的格式解释其输出。 译员可能具有临床、流行病学或分析背景,但这不是先决条件。 沟通和领导技能、敏捷的思维方式以及将目标转化为分析、将洞察转化为行动和影响的能力是先决条件。

AA 专家收集技术数据并为每个用例构建算法。 统计学家设计了稳健的研究并帮助最大限度地减少偏见。 数据工程师创建可重用的数据管道,结合多个数据源进行建模。 机器学习 (ML) 专家使用这些数据来构建高性能预测算法。

这四组专家反复合作来交付用例,就像软件团队通过敏捷冲刺交付项目一样。 这种方法使团队能够与临床和业务利益相关者一起测试早期输出,并根据需要调整过程。

在分析团队中架起不同文化的桥梁
制药公司倾向于从两种历史上不同的文化中吸引分析专业人员,这些文化具有不同的优先事项和方法论基础。

生物统计学家的文化基于解释性模型:模拟 RWD 条件来模仿随机临床试验 (RCT) 设置,以便团队可以从数据中提取正确的因果关系。 解释性建模依赖于模仿 RCT 条件的倾向评分等技术,以及依赖置信区间和 p 值来评估研究结果的稳健性并避免错误发现。

相比之下,数据科学家和 AA/ML 从业者的文化侧重于预测建模:使用灵活的模型来捕获数据中的异质性并对新示例提供良好的预测。 预测建模依赖于增强和集成等方法,这些方法在大数据环境中往往效果更好。 这些专家寻求最大限度地提高预测性能,甚至(有时)以牺牲解释性见解为代价。

当然,这种二分法是人为的,许多角色横跨这两种文化:例如,许多数据科学家具有生物统计学背景,许多流行病学家和生物统计学家了解大数据集上的数据工程和机器学习工作流程。 将这些分析文化整合到一个多学科团队中对于充分利用大型 RWE 数据集至关重要。 根据我们的经验,当生物统计学家或流行病学家负责个体因果发现的统计准确性以及机器学习专家负责预测的准确性和概括时,团队会产生最大的影响。 这两类专家还必须与临床专家和数据工程师密切合作,以了解涉及数据质量或选择机制的问题。 这些问题包括系统性地少报实验室数据或其他偏见来源。

来自两种文化的从业者有时会在优先事项上发生冲突,莱茵集团领导者必须解决这些问题。 最好的结果是通过从影响中进行推理而不是从方法中进行推理来实现的。 对于给定的用例,这意味着确定什么会产生影响,例如,支持监管审批、提高发布的可能性、最大化预测性能或优化可解释性。 然后团队必须决定哪种方法或方法组合最适合该目标。

在这种情况下,区分假设生成和假设验证非常重要。 Generation 专注于识别代表新研究途径的相关性或模式,并随后通过后续临床试验或其他方式进行确认。 验证使用更保守的方法,旨在避免错误的发现并创造新的见解。 在研究中使用 RWE 来生成假设可以通过纳入更大、描述更丰富的队列来极大地扩展制药公司的研究视野。 RWE 或其他观察数据也可用于验证假设,但要在更严格的条件下,有时与 RCT 数据结合使用。 生成和验证都可以使用AI/ML和生物统计方法的结合,但生成更强调AI/ML,验证更注重生物统计方法。

一家制药公司开发了一种工具,可以使用保险索赔数据尽可能准确地预测个体患者的风险。 这个共同目标的明确性使团队能够选择合适的方法,以敏捷的方式工作,并避免有关方法论的争论。 例如,当一位生物统计学家表达了对更可解释但性能较低的模型的偏好时,团队只需参考共同一致的目标就可以解决争论。

让团队专注于 AA 增加价值的场景
从最有可能证明分析方法价值的案例开始,有助于确保高级管理层的支持,这对于平台和流程转型的成功至关重要。 通过关注正确的案例,制药公司可以加深对患者具体结果的了解,帮助医生做出更好的决策,扩大药物在已批准适应症中的使用,并更广泛地推进科学知识。

AA 方法可以帮助在治疗价值链的许多领域生成证据(图表 1),例如结合 RCT 和 RWD 来优化研发试验的设计。 领先的制药公司已经看到了四个重要领域的影响:头对头药物比较、药物警戒的效益和风险评估、治疗决策的驱动因素以及临床决策的支持系统。

头对头药物比较
在这些研究中,公司分析证据以确定哪些患者对特定疗法反应最好,或者哪些患者亚组从某种疗法中获益比从其比较者中获益更多。 面对面的比较可以产生有价值的见解:例如,患有特定合并症的老年患者可能会从感兴趣的治疗中受益最多。 这些见解可以帮助医疗保健利益相关者做出更好的决策,告知医生可能带来最佳结果的治疗方法,并纳入未来临床试验的设计。 比较分析的证据也可以提交给监管机构,以支持治疗的标签扩展,而无需进行新的临床试验。

解释模型的进步使公司能够在适当的统计框架内应用机器学习技术,以推断 RWD 的因果效应。 通过将预测方法与头对头观察研究中的因果推理相结合,公司可以比传统方法获得更广泛患者的证据,并探索可能获得更好结果的更全面的亚群。 与传统方法相比,机器学习技术的使用还可以改善混杂因素控制,并更准确地估计治疗效果。

通过先进的分析,研究还可以自动扩展头对头比较,并在许多临床终点、治疗和患者组中重复它们。 然后,这些分析可以通过交互式仪表板或其他数字资产呈现给更广泛的企业,不仅可以提供对结果、治疗差异化和未满足需求的深入见解,还可以帮助团队生成证据以进一步大规模验证。

药物警戒的效益和风险评估
机器学习算法的使用使公司能够连续筛选现实世界的数据以查找各种潜在的不良事件,并标记治疗的新安全风险(或信号)。 一旦发现风险,研究人员就可以评估风险并将其与收益进行权衡。 以这种方式使用真实世界的数据来检测极少数接受牛津/阿斯利康 COVID-19 疫苗的患者中的血凝块,并用于欧洲药品管理局安全委员会随后对该疫苗的效益/风险评估。 3 使用患者的大量实时数据源使研究人员能够捕获罕见疾病的信号,并获得有关治疗风险和益处的新见解,从而有助于改善药物警戒流程。

机器学习还使公司能够持续筛选各种潜在的不良事件,并集成大型非结构化数据集,否则这些数据集将很难自动处理。 例如,算法不仅可以用专家可以解释的信息(例如症状、疾病状态和严重程度)来注释临床病例报告,还可以根据相关性对这些报告进行优先级排序。 这使得对潜在信号的医疗案例审查更加高效,检测更加严格。 最后,与头对头药物比较一样,机器学习算法可以生成因果关系证据,从而改进对更广泛的患者资料中已知安全风险的评估。

为了创建工业化的收益/风险平台,可以将算法嵌入到强大的数据工程工作流程中,扩展到广泛的数据集,并按定期的自动化计划进行处理。 此类平台使药物警戒团队能够随时获取自动化、标准化和强大的洞察,以了解整个资产组合中的大量潜在信号。

治疗决策的驱动因素
对 RWD 的分析可以揭示是什么促使患者改变治疗、调整剂量或停止治疗,以及是什么促使医生开出不同的治疗或剂量。 例如,接受某种治疗的患者如果在开始治疗后的三个月内看过专科医生,则更有可能停止治疗。 通过对潜在的选择机制进行敏感性分析,可以进一步验证这些有价值的见解。 使用反概率审查加权等技术可以帮助公司了解退出观察窗口的患者与未退出观察窗口的患者是否存在系统性差异。 然后,医生可以利用这些见解来帮助患者继续治疗并从中获得最大益处。

预测建模可以深入了解治疗决策的复杂驱动因素,并且可以比经典 RWE 分析更大规模地实现这一点:例如,预测治疗决策的患者特征组合或预测个体患者特征(可能是非线性)的方式 影响决策的可能性。 使用经典技术,研究人员通常必须手动将此类关系编码到算法中。 可解释的人工智能 (XAI) 技术(例如 SHAP)或因果推理方法(例如贝叶斯网络)可以提供治疗决策驱动因素的详细视图。 它们还可以揭示群体之间的差异影响患者特征的方式:例如,高龄可能会降低全科医生看诊的患者治疗转换的风险,但会增加专科医生看诊的患者的治疗转换风险。

由于公司可以在治疗过程的许多方面使用相同的预测建模方法,因此可以扩大模型的规模,以跨决策点和整个患者群体扫描特定适应症的驱动因素。 这种方法有助于生成有关各种治疗决策的潜在驱动因素的详细证据,而不仅仅是公司自己的疗法。

临床决策支持系统
决策支持系统在临床环境中越来越常见,旨在通过提供患者信息和相关临床数据来改善医疗决策。 这些系统通常是使用大型现实数据集开发的,并且受到严格的监管审查。 通常,他们依赖的算法可以预测(作为数千个患者级别特征的函数)患者在就诊后一周内发生心力衰竭的风险。 此类系统有助于提高护理标准、降低成本并提高患者的安全。

研究人员表明,通过用机器学习技术(例如定制的神经网络架构和基于树的方法)取代经典统计模型,可以显着提高临床决策支持系统生成的预测的准确性。 此外,可以采用 XAI 技术(就像治疗决策驱动程序一样)来帮助医生有效地解释和使用这些工具。 因此,算法设计得与统计模型一样可解释,但又不牺牲预测性能。 这些算法包括广义加性模型 (GAM) 及其机器学习模型 (GA2M),它们正在医疗保健领域站稳脚跟。

机器学习算法生成的预测和解释可以在支持临床决策的应用程序中呈现给医生(图表 4)。 为了确保易用性,开发这些应用程序的公司从早期阶段就让用户体验设计师与医生密切、反复地合作。

搭建技术平台,安全扩容
为了从 AA 实验发展到跨适应症、疗法和地点部署扩大的用例,RWE 领导者必须构建一个包含五个关键组件的技术平台。 有了正确的数据环境、工具、流程、团队和道德原则,公司就可以快速开发分析用例并将其扩展到整个产品组合中。

集成数据环境应该用工业化、互联的数据环境取代临时数据集,使用户能够通过中央数据湖访问全面的数据集集合。 在这样的环境中,数据目录的实施符合业务优先级和清晰的 RWE 数据源地图。 数据集被摄取,然后通过可重复的数据工程工作流程进行丰富:例如,可以创建常规工作流程以根据患者的病史构建患者的特征表示,然后多个分析应用程序可以使用这些表示。 链接的数据集成为组织中任何人都可以使用的专有知识。 通过创建工业化流程来管理和跟踪数据访问、元数据、数据沿袭和合规性框架,公司可以帮助确保工作流程稳健且可重复,并且所有 RWE 分析都能保持数据的完整性和透明度。
现代工具用企业级分布式科学和计算工具取代了分散且分散的计算资源。 为了避免干扰日常业务运营,分析通常在与其他系统分开的类似实验室的环境中开发。 该环境必须灵活且可扩展,以处理许多不同的分析方法:例如,使用笔记本工作流程。 数据工程师必须能够在需要时访问可扩展的资源以支持数据处理工作流程。 同样,数据科学家必须能够灵活地在常用编程语言(例如 Python 和 R)之间切换,以使用他们所需的建模软件包。 根据他们的分析方法,他们可能还需要访问旨在加速深度学习工作流程的硬件。
机器学习操作 (MLOps) 用工厂式环境中的自动化流程取代了部署模型的手动流程,在工厂式环境中,分析模型可以持续大规模运行。 (这有助于缩短开发时间并使模型更加稳定。)自动化集成和部署使用户能够可靠地访问分析解决方案。 同时,为了管理模型的性能、控制风险并防止对运营产生不可预见的不利影响,监控流程应定期检查算法生成的预测。 具有 MLOps、软件操作 (DevOps) 和平台设计技能的中央平台团队通常会构建工厂环境并开发流程。

分析产品团队取代了项目团队,专注于相互加强的用例。 他们构建可重复使用的模块化软件(或数据产品),并在将用例扩展到新的治疗领域或业务部门时,根据业务需求组装和配置这些元素:例如,使用丰富的 US 构建的通用数据模型和算法 通过仅选择相关组件,可以将数据集移植到数据更有限的另一个区域。 这种方法使公司能够扩大跨适应症、疗法和用例的证据生成,并允许研究人员对多个患者结果和亚群进行数百次分析。

定义产品成功标准并负责实现短期和中期目标的产品负责人领导这样的团队。 其其他成员的个人资料与莱茵集团 (RWE) 团队相似。 每个产品团队都为自己的用例开发和改进方法,同时与其他团队合作以获取数据产品之间的协同效应。

数据科学和机器学习的道德原则可确保安全地从 RWD 和其他复杂数据源中提取见解。 应注意避免对弱势群体或历史上代表性不足的群体造成过度伤害的任何风险。 人工智能中的风险管理是一个复杂且快速发展的领域; 监管机构、专业机构和思想领袖对此制定了越来越复杂的立场。
人工智能风险管理不仅仅涉及标准数据道德承诺,例如尊重隐私和安全处理敏感数据。 这里的问题包括模型的可解释性(以便非专业人士能够理解它们)和公平性(以便它们在性别或种族等方面具有可比较的错误率或其他标准)。 具有道德意识的心态认识到,由于历史差异,RWD 中可能存在偏见。 在 RWE 中构建队列和终点时,通过使用临床输入和护理,以及自动分析预测算法公平性的 AA 技术,采取措施来检测和减轻这种偏差。 这些措施应辅之以使用尊重隐私的技术、具有明确责任和所有权的现代数据治理以及可解释的方法(而不是黑盒算法)。

当成功的公司将 AA 应用于现实世界的数据时,他们会创建跨学科团队,专注于展示价值的用例,并构建平台来提供集成的数据环境。 通过这种方式扩大规模,先进的 RWE 分析可以帮助组织做出更客观的决策,并将重点从产品转移到患者。 通过这种方式,它支持了更广泛的目标,即在正确的时间向正确的患者提供正确的药物。

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

七爪网 行业资讯 使用高级分析大规模生成真实世界的证据 https://www.7claw.com/58337.html

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务