基于基线T2WI,图对进展期直肠癌经放化同期治疗后病理完全缓解的多模型预测比较
杨镜玉 ,许 宁 ,张雨涛 ,黄凤昌 ,蒋元明 ,殷 亮
(1)昆明医科大学第一附属医院肿瘤科;2)影像科,云南 昆明 650032)
在最新发布的中国恶性肿瘤流行报告中,结直肠癌是我国第二大常见癌种,占总病例数的10.04%,每年有超过40.80 万人被诊断为结直肠癌,其中超过半数是局部进展期直肠癌(locally advanced rectal cancer,LARC)[1−2]。目前对于LARC 患者,新辅助同期放化疗(neo-adjuvant chemoradiotherapy,nCRT)联合全直肠系膜切除术(total mesorectal excision,TME)是标准管理模式。大约15%~27%的患者在接受了nCRT 后达到病理完全缓解(pathologic complete response,pCR)[3],此部分患者可以选择“等待-观察”治疗策略,对于有强烈保肛要求的低位直肠癌患者以及无法耐受手术的患者来说,显然是更优的选择;
而对于不能从nCRT 治疗中获益的患者,可以考虑选择免疫治疗或全程化疗[4]。因此在新辅助同期放化治疗前评估和预测肿瘤反应将有助于患者治疗。
随着人工智能及可视化运用技术的进步,可以从图像中提取定量特征,通过研究这些特征与潜在病理变化的关系为临床决策提供依据,这种方法被称为影像组学[3]。机器学习(machine learning,ML)是人工智能领域的一个分支,是利用计算机算法学习回顾性数据中非线性关联,用于预测及估计产生特定结果的概率[5]。目前大型成像数据集的影像组学分析联合机器学习已经成功应用于肿瘤学领域,在肿瘤预后预测和疗效评估中起重要作用。至于基于核磁共振成像的定量纹理数据为什么能够预测治疗反应的确切原因仍是未知的。目前普遍认为,肿瘤的生物学行为,包括治疗敏感性,在很大程度上可能还是由其潜在的分子分型决定的。依靠机器学习从影像中提取出深层特征,使微观结构模式改变在宏观影像中有所呈现,可以反映人体微观水平的变化[6]。目前研究表明,基于纹理的放射建模可以评估肿瘤异质性,并可以将肿瘤学中的放射学前沿发现与潜在的基因组和生物学特征(包括预后和治疗反应)联系起来[7−8]。
已有基于MRI 的影像组学预测模型被应用于预测直肠癌放化疗后的肿瘤反应的报道[3,9−10]。然而不同的研究采用的目标图像序列和预测模型构建方法不同,哪类模型在评估nCRT 后病理完全缓解方面效果最佳还没有定论。因此需要通过对不同序列的不同模型来评估肿瘤反应。
本研究旨在基于基线T2WI 影像组学数据,采用3 种不同模型构建方法构建3 种预测模型,以预测患者nCRT 后pCR 率,并比较这些预测模型在本数据集中的表现,探索最稳定的预测模型临床运用价值。
1.1 研究对象
1.1.1 患者资料本研究得到了昆明医科大学第一附属医院伦理委员会的批准,免除了知情同意的要求。根据以下纳入和排除标准,在2017 年1月至2021 年12 月期间接受手术治疗的201 名患者纳入本研究。
纳入标准[9,11]:(1)经病理活检证实的原发性直肠腺癌;
(2)初始MRI 评估后确定为局部进展期直肠癌;
(3)均接受完全新辅助放化疗,且nCRT 前未接受过任何治疗;
(4)nCRT 结束后均接受TME 手术,术后经术后病理检查证实;
(5)使用相同的3-T 磁共振扫描仪获得基线MRI 数据,即高分辨率T2WI 轴位图。
排除标准[9,11]:(1)未完成新辅助放化疗;
(2)未在本院接受手术,或未经术后病理确证;
(3)缺乏高分辨率T2WI 数据;
(4)MRI 质量不足,无法获得测量结果(如运动伪影);
(5)TME 后病理证实为粘液腺癌。
经筛选共有131 名符合纳入标准的患者纳入本研究,患者根据4∶1 的比例被分配到训练集和测试集;
其中104 名患者被分配到训练集,27 名患者被分配到测试集。
1.1.2 新辅助放化疗方案所有患者在手术前均接受规范长程同期放化疗,放疗总剂量为50.6 Gy(GTV)/41.8 Gy(CTV),每周5 次,疗程为30 d。GTV 定义为包括直肠系膜在内的原发肿瘤的体积。CTV 定义为原发肿瘤区、直肠系膜区、骶前区、直肠系膜淋巴结、侧方淋巴结、髂内淋巴结和盆壁区域。放疗期间同时口服卡培他滨治疗,口服剂量825 mg/m2,每日2 次。放疗完成后予以2 个周期的XELOX(卡培他滨+奥沙利铂)方案巩固性化疗。放疗结束后8~11 周行TME 手术。
1.1.3 病理完全缓解的评估手术切除的标本由经验丰富的病理科医师进行组织病理学检查和分析,并由胃肠道病理学家进行进一步检查,双方都对MRI 数据不可见;
病理完全缓解(pCR)的定义是原发肿瘤和淋巴结中没有存活的肿瘤细胞(图1A、图1B)。
图1 患者基线轴位T2WI 图上ROI 绘制、病理学表现和病理完全缓解病理学表现Fig.1 ROI on patient baseline T2WI、pathological manifestations and pathological complete response of pathological manifestations
1.2 MRI 数据采集和检索程序
所有患者在新辅助放化疗开始前1 周内均进行了基线MRI 检查。采用德国飞利浦公司3.0-T磁共振扫描仪,采用8 通道相控阵线圈,扫描时将髂前上棘连线水平作为定位线。患者在检查前需禁饮、禁食4~6 h。所有患者均接受常规直肠MRI 检查,包括轴位、冠状位、矢状位和垂直于直肠长轴T2WI 图像,本研究涉及直肠MRI 扫描序列参数见表1。
表1 直肠癌MRI 扫描序列及参数Tab.1 MRI scan series and parameters of rectal cancer
1.3 图像分割、影像组学特征提取和建立模型
1.3.1 图像分割由1 名接受过肿瘤成像培训且具有3 a 以上影像诊断学经验的放射科医生使用AK 软件(Analysis Kit,GE Healthcare)对初始轴位T2WI 图上逐层绘制感兴趣区(region of interest,ROI),包括整个肿瘤,但不包括肠腔及肠内容物(图1C),绘制中为提高准确性,同时可参考患者其它扫描序列,如T1WI、DWI。然后由1 名具有5 a 直肠MRI 诊断经验的放射科医师分别按照上述规则,独立审查分割图像,对有异议的图像分割进行讨论达成一致。
1.3.2 影像特征提取和 统计分析使用AK 软件(Analysis Kit,GE Healthcare)从手动分割的ROI治疗前T2WI 数据中进行特征提取,从T2WI 序列中提取1308 个量化特征,所有特征提取算法均使用AK 软件实现。
1.3.3 特征筛选、模型建立及统计学处理为了尽量减低小样本量影像组学模型过拟合问题,运用双样本t检验+LASSO 回归对训练集(104 例)患者影像组学特征进行特征筛选,根据特征权重系数选择对模型贡献大的特征,分别构建3 种预测模型:支持向量机(support vector machine,SVM)、逻辑回归(logistic regression,LR)、随机森林(random forest,RF)学习模型。每个模型都使用了相同的筛选特征构建模型。将训练集随机均分为5 份,每次抽取1 份作为验证集,余下4 份作为训练集,即5 折交叉验证。训练集数据集分别用于构建3 种机器学习模型,完成模型构建后,分别将同组验证集数据代入构建模型,并运用随机搜索命令,最终确定模型最佳超参数(C 值、gama 值)设置。本研究最终使用ROC 曲线,分析评估不同学习模型的诊断性能,并将测试集数据代入最终模型评价模型性能。计算ROC 曲线下面积(area under curve,AUC)、特异度、准确度、灵敏度。依据3 个模型在测试集上的准确度、灵敏度、特异度表现,来选择一个最优模型。以上所有过程都是通过Python(https://www.python.org/)实现的。其中读取、整理、清洗数据使用python 中numpy、pandas、scipy 数据库中函数完成;
绘图使用matplotlib、seaborn 数据库中函数完成;
构建模型、交叉验证、随机搜索使用sklearn 数据库中函数完成。
本研究中男性43 例,女性88 例,其中治疗后达pCR 的患者26 例,未达pCR 的患者105 例。按4∶1 的比例分为训练集(104 例)和测试集(27 例),训练集和测试集2 组间临床特征、分化程度、MRI 肿瘤T 分期、N 分期无统计学意义(P>0.05)(表2)。
表2 临床流行病学特征[( )/n(%)]Tab.2 Clinical epidemiological characteristics [()/n(%)]
表2 临床流行病学特征[( )/n(%)]Tab.2 Clinical epidemiological characteristics [()/n(%)]
首先采用双样本t检验对组学特征进行初步筛选,所有特征按P值递增顺序进行排序,并将没有显著差异的特征(P>0.05)排除;
然后通过LASSO 回归获得12 个最优影像特征(图2)。利用筛选出的影像特征进行模型构建,表3 展示了Lasso 回归筛选出的特征及其权重系数,图3 展示了特征筛选后最优12 个特征的特征权重图(A)及特征相关性热图(B)。
表3 Lasso 回归筛选特征及其权重系数Tab.3 Lasso regression screening features and their weight coefficients
图2 LASSO 回归筛选特征参数系数图Fig.2 LASSO regression screening feature parameter coefficient map
图3 影像特征及影像组学标签Fig.3 Image features and radiomics labels
本研究利用筛选的最优影像特征,探索了3种模型算法:支持向量机(SVM)、随机森林(RF)、逻辑回归(LR)学习模型。依据交叉验证及随机搜索结果,获取模型最佳参数,绘制ROC 曲线(图4)。3 种模型的预测效能,见表4。在本数据集中,逻辑回归(LR)模型预测效能最佳。
图4 基线T2WI 预测LARC 患者nCRT 治疗后达pCR预测模型ROC 曲线Fig.4 Baseline T2WI predicts the ROC curve of the pCR prediction model for LARC patients after nCRT treatment
虽然既往有不少研究构建了基于MRI 预测nCRT 治疗后pCR 的模型,且取得了不错的预测效能[11−13]。但与这些研究中纳入模型的许多特征是来自于新辅助治疗后的MRI[13]不同的是,本研究利用新辅助治疗前MRI,旨在探索是否能够在nCRT 治疗前就筛选出对nCRT 治疗敏感的患者,避免使那些无法从放疗获益的病人,因分期较晚而进入nCRT 治疗。其次,本研究仅使用了T2WI 单序列进行预测模型构建,虽然没有多序列研究信息丰富,但仍有不错的预测效能。这可能归因于2 方面原因:(1)T2 加权像成像清晰,更有助于影像科医师准确勾画ROI,与功能序列得到的图像(如扩散加权图像)相比,该序列得到的图像具有较好的稳定性和易获取性;(2)更多成像序列的纳入,意味着更多需要统一的成像协议,纳入多序列影像特征,经过数据标准化、归一化处理,可能引入更多偏差,改变数据真实权重分布。本研究仅利用基线T2WI 单序列数据进行影像组学分析,分别构建逻辑回归、随机森林、支持向量机3 种模型对LARC 患者nCRT 治疗后能否达到pCR 进行预测。
通过对比3 个模型预测效能。本模型与已报道的模型相比,展现出良好的预测效能[14–17]。首先,笔者的研究可以证明利用影像组学结合机器学习方法,具有在患者基线水平上对nCRT 治疗反应进行预测的潜力,本研究所构建的3 个模型在测试集上,AUC 分别为0.8810(SVM)、0.7579(RF)、0.9206(LR),均展现出不错的预测效能。相比之下,Shaish 等[16]回顾性分析了2 中心共132 例LARC 患者基线T2WI,构建逻辑回归预测模型,其中pCR 的最佳AUC 为0.80(95%CI,0.74~0.85)。该研究特别之处在于ROI 绘制区域不仅仅局限于病灶,还涵盖肠系膜筋膜区域,为ROI 绘制提供了新思路。Horvat 等[15]回顾性分析了114 例LARC 患者的基线T2WI 和DWI,构建随机森林预测模型,其中pCR 最佳AUC 为0.93(95%CI0.87-0.96)。Antunes 等[17]回顾性分析了3 中心共104 例LARC 患者基线T2WI,构建随机森林预测模型,其中pCR 最佳AUC 在外部验证集为0.712。虽然该研究没有取得很好的预测效果,却为研究模型泛化提供了更多实据。Yi等[14]回顾性分析了单中心共134 例LARC 患者基线T2WI,构建随机森林和支持向量机的集成预测模型,其中预测pCR 的最佳AUC 为0.9078(95%CI: 0.83~0.98)。该模型能获得上佳的预测性能主要得益于其自研的集成模型,为模型构建提供了新的思路。笔者的优势在于运用了3 个模型,并对模型预测性进行了比较;
且没有纳入临床信息参与模型构建,模型仍然展现出不错的预测性。纵观以往研究,3 种机器学习方法都被不同研究者选用,且展现出不错的预测效能,说明这3 种方法都可以较好的处理这类二分类问题,但并没有哪种方法取得了绝对的优势。就本测试集上预测结果而言,逻辑回归预测模型展现出更佳的预测效能,这也恰好体现出逻辑回归擅长概率预测的特性,并可以直接计算出预测概率。而支持向量机模型在本数据集中并没有发挥出对多维数据处理的优势,原因可能是特征分布分散,没有找到合适的核函数。而随机森林模型则受限于样本量小,也没有因其投票特性获得更佳的预测效能。这也反应出随机森林模型因其生成决策树的随机性,有时并不会实现预测效能的加成。综上,对于二分类问题,3 种模型都值得尝试;
其中逻辑回归模型可以直接输出预测概率,易于实现,但对多变量特征处理能力有限;
支持向量机模型,可以解决高维特征问题,但有时难以找到合适的核函数;
随机森林模型,抗拟合能力强,可不用做特征筛选,但由于其生成决策树随机,生成过多相似决策树,可能会掩盖真实结果。因此,笔者的研究对于针对同一预测任务的不同模型比较筛选,提供了一些解决思路以及一些开源数据。
本研究仍存在一些不足之处,首先作为一个回顾性研究,可能存在选择偏差;
且研究样本量有限,其中pCR 样本占比较少,可能会影响预测模型的准确性和稳定性;
其次本研究所构建的预测模型及模型验证都使用的是单中心数据,在外部验证集中的预测效能有待进一步评价;
最后本研究仅将pCR 作为nCRT 治疗敏感的终点指标,临床实践中,TRG 降期也能一定程度说明对nCRT 治疗敏感,这个指标有待后续研究评价。
热门文章:
- 酒店总经理年度工作总结8篇2024-12-07
- 2023年度大一上学期期末个人总结800字10篇(完整)2024-12-07
- 2023年高三综评期末总结8篇2024-12-07
- 四年级科学的教学总结6篇【精选推荐】2024-12-06
- 期末颁奖总结3篇(范文推荐)2024-12-06
- 医院客服年终个人总结7篇2024-12-06
- 2023年度高校寒假安全教育主题班会总结12篇(2023年)2024-12-06
- 2023年有关学生期末个人总结7篇(范文推荐)2024-12-06
- 2023年度公司业务部年终总结10篇2024-12-06
- 园林绿化有限公司年度工作总结5篇【完整版】2024-12-06
相关文章:
- ct医师述职报告优秀参考例文范文2022-08-23
- 病理科技术员工作职责(5)(2022年)2022-08-23
- 放射技师个人工作总结2022-08-23
- 2016年技术员年度工作总结例文【优秀范文】2022-09-06
- 病理科医生年终总结2022-09-06