免疫疗法可用于治疗几乎所有晚期非小细胞肺癌(NSCLC)患者。然而,识别准确的预测性生物标志物仍然具有挑战性。纪念斯隆凯特琳癌症中心(MSK)的研究学者通过整合放射学、组织病理学和基因组学特征,建立了一个DyAM(Dynamic Deep Attention-based Multiple-instance Learning Model with Masking)模型,来预测免疫治疗反应的能力。研究结果“Multimodal integration of radiology, pathology and genomics for prediction of response to PD-(L)1 blockade in patients with non-small cell lung cancer”在今年九月发表在Nature cancer杂志上。来自这些模式的原始数据可以通过机器学习和图像分析工具自动进行特征提取。因此,这些模式的基于机器学习的集成代表了通过计算患者特定风险评分来推进PD-(L)1阻断剂治疗的精准肿瘤学的机会
一 研究方法及结果
01 建立非小细胞肺癌多模式队列以预测反应
研究在MSK癌症中心确定了247名晚期NSCLC患者,这些患者在2014年至2019年接受了PD-(L)1阻断剂治疗,基线数据和已知结果称为多模式队列。其中,标准临床生物标志物,包括PD-L1肿瘤比例评分(TPS)和肿瘤突变负荷(TMB),在多模式队列中有应答者和无应答者之间存在显著差异;然而,使用这些特征的分类模型无法将两组完全分开。
因此,从MSK-IMPACT临床测序平台为多模式队列收集了常规的临床信息,包括CT扫描、含有NSCLC的组织中的PD-L1 IHC数字病理结果和基因组特征。利用这些数据建立了多模式生物标志物。首先单独量化每种模式的预测能力,然后将所有可用数据组合成多模式生物标志物,以构建预测响应的算法(图1e)。通过合并测试集的结果,进行了十倍交叉验证,以获得整个多模式队列的模型预测结果(图1f)。
图1 非小细胞肺癌的多模式队列特征和模式
02 PD-L1纹理特征评估
在对PD-L1染色的评估过程中,研究基于HALO AI深度学习的方法对PD-L1染色进行了评估。首先创建深度学习算法用于识别PD-L1染色组织中的肿瘤区域。训练涉及多个组织切片的圈注,用以训练深度学习网络模型。其中圈注的类别包括:肿瘤、间质、淋巴细胞、坏死、纤维弹性疤痕、肌肉、良性肺组织和玻片背景。然后在多模式队列的所有PD-L1染色的组织切片中使用经训练好的网络模型进行分析。随后由胸部病理学家手动评估每张组织切片的肿瘤部分并进行特异性评分。该分数被定义为肿瘤组织的比例,然后手动圈注分数低于95%的组织玻片。此外,研究对PD-L1的染色模式进行了定量。在使用HALO AI分类完成后获取到肿瘤组织,并对这些分类后的组织图像进行颜色反卷积以将PD-L1染色与苏木素分开。然后,基于灰度共生矩阵(GLCM,Gray-Level Co-occurrence Matrix)用于表征PD-L1表达,GLCMs通常用于图像处理中以量化相邻像素的相似性(图2a)。最后,从像素级GLCM映射中计算汇总统计数据,包括平均值、标准差和自相关性,用于下游分析。
结果发现,PD-L1 IHC纹理特征与免疫治疗反应具有广泛统计学关联的特征(图2b)。LR拟合的其他重要特征包括cluster shade skewness和Imc2 kurtosis,它们对整体PD-L1染色强度不太敏感(图2c)。此外,GLCM自相关分布与病理学家评估的PD-L1 TPS显著且反向相关(图2d),表明具有IHC纹理的自动特征提取可以近似于胸科病理学家的评估。使用基于自相关矩阵的18个特征和像素强度分布(IHC-A)的统计数据进行LR建模,预测精度为AUC=0.62,这与病变范围的放射学平均值(AUC=0.65)相当,但低于病理学家评估的PD-L1 TPS(AUC=0.73)(图2e)。虽然包括TPS和IHC-A特征降低了AUC(图2e),但其他分类器性能指标包括准确度、召回率和F1分数增加。包括所有150个GLCM特征(IHC-G)的预测准确度为AUC=0.63。
图2 PD-L1免疫组化特征推导和反应预测
03 通过深度学习的多模式集成可以改进预测
在评估了单模式特征的预测能力后,接下来实施了DyAM模型,以结合放射学、组织学和基因组学特征预测PD-(L)1阻断治疗反应的影响(图3a)。
结果发现使用PD-L1 TPS评分的三种数据模式得出最高准确度(AUC=0.80)。这与所有模式的LR评分平均值(AUC=1.72)形成对比。所有多峰动态分析结果均显著高于通过置换测试获得的零假设AUCs。然后使用多变量Cox回归将DyAM模型与已建立的免疫治疗反应生物标志物以及临床混杂因素进行比较。研究表明,所建立的多模态模型(AUC= 0.80,)优于单模式特征,包括肿瘤突变负荷(AUC=0.61)和PD-L1免疫组织化学评分(AUC=0.73)。
图3 基于DyAM的单峰和多峰响应预测
图4 基于DyAM的多模式分析
二 研究结论
整合生物医学成像、组织病理学和基因组分析以指导肿瘤治疗决策仍处于初步阶段。该研究展示了自动从不同模式中提取判别特征的机器学习方法具有互补和组合的能力,可以识别接受免疫治疗的高风险和低风险NSCLC患者。本文的研究表明,常规诊断数据(包括基线CT扫描、组织病理学切片和临床下一代测序)中的信息内容可以结合起来,以改善对PD-(L)1阻断治疗反应的预测,优于单独使用任何一种方式和标准的临床方法。
本文的结果表明可以使用计算和机器学习方法,特别是基于HALO深度学习和图像分析算法对组织病理学切片进行定量和评估,对来自多种癌症诊断模式的现有数据进行注释、提取和组合,以用于非小细胞肺癌免疫治疗反应预测的下一代生物标志物开发。本文的DyAM模型是整合多模态数据的一种有潜力的方法,未来使用更大数据集的模型将有可能增强当前治疗决策中的精确肿瘤学实践。
关于我们
Indica Labs为您提供病理图像分析的全套解决方案,包括可进行高通量、全切片式的组织分析的图像分析的病理图像分析平台HALO®和人工智能系统HALO AI™,以及可以实现数据管理和与外界共享的HALO Link™系统。凭借无与伦比的易用性和可扩展性,在免疫肿瘤学、肿瘤学、移植科学、神经科学、眼科、代谢、呼吸和毒性病理学等领域有着广泛的应用。目前用户遍布于全球的生物制药公司、医疗和研究组织。