如何将多模态CT深度学习特征与肿瘤微环境中的免疫相关生物学过程建立关联，并进一步解释其与非小细胞肺癌新辅助免疫化疗后的pCR机制联系

张

张建站

2026/5/2 2:14:45

10分钟阅读

如何将多模态CT深度学习特征与肿瘤微环境中的免疫相关生物学过程建立关联，并进一步解释其与非小细胞肺癌新辅助免疫化疗后的pCR机制联系

01导语各位同学大家好。现在做影像组学如果还只停留在“提取特征—建个模型—算个AUC”那就有点像算命算得挺准但为啥准自己也说不明白。别人一问你这特征到底代表啥背后有啥道理瞬间就成了黑箱本箱。而真正能打高分、站得住脚的研究都在干一件事——给影像组学找“生物学娘家”让宏观图像和微观病理、细胞、基因、通路对上话。今天咱们就通过一篇经典文献——非小细胞肺癌新辅助免疫化疗后pCR预测的多模态CT深度学习研究看看作者如何把平扫CT和增强CT的深层特征与肿瘤微环境中的异质性、血管生成、淋巴细胞浸润等关键生物学过程挂靠起来。用轻松又实在的方式聊聊影像组学怎么优雅、合理、不硬凑地挂靠生物学机制从“只会算分的工具人”升级成“能讲清疾病故事的研究者”。★题目Non-invasive multimodal CT deep learning biomarker to predict pathological complete response of non-small cell lung cancer following neoadjuvant immunochemotherapy: a multicenter study无创多模态CT深度学习生物标志物预测非小细胞肺癌新辅助免疫化疗后的病理完全缓解★期刊《Journal for ImmunoTherapy of Cancer》中科院1区IF10.6★研究疾病非小细胞肺癌NSCLC★生物学机制肿瘤微环境TME的免疫状态★发表时间2024年9月02研究背景-从 “临床问题” 落到 “生物学问题”非小细胞肺癌NSCLC是全球发病率和死亡率最高的恶性肿瘤之一近年来新辅助免疫化疗的广泛应用显著提高了患者的病理完全缓解pCR率而pCR与患者长期生存密切相关。然而目前pCR的金标准仍依赖于术后病理检查属于有创、延迟且无法用于治疗前决策的手段。临床实践中常规CT影像评估与病理反应之间存在显著差异例如在NADIM试验中高达73%的影像学部分缓解患者实际达到了pCR这种“影像-病理不一致”主要源于免疫治疗诱导的淋巴细胞浸润、假性进展等生物学现象。因此亟需开发一种非侵入性、精准的影像生物标志物能够在治疗前预测pCR。从生物学机制角度看pCR的实现依赖于肿瘤微环境TME的免疫状态包括肿瘤异质性、血管生成、细胞密度、淋巴细胞浸润等过程。这些生物学特征虽然无法通过肉眼直接观察但可能隐藏在CT图像的纹理、形态和增强模式中。传统影像组学方法多基于手工特征或自然图像预训练模型难以充分捕捉这些深层生物学信号。为此研究者需要借助大规模医学图像预训练模型foundation model提取深层特征并结合多模态CT信息平扫增强从而将影像表型与潜在的肿瘤免疫生物学机制关联起来。本研究的背景正是立足于这一“临床需求—生物学机制—技术路径”的逻辑链条试图填补影像学与病理学之间的鸿沟。03研究目的明确写出“三层目的”本研究的总目标是构建一种基于多模态CT深度学习的非侵入性影像生物标志物用于预测NSCLC患者新辅助免疫化疗后的pCR。具体而言研究目的分为三个层次第一临床层开发一个能够在实际临床场景中应用的预测模型帮助医生在治疗前识别出最有可能达到pCR的患者从而避免不必要的手术或过度治疗推动精准治疗和“观察等待”策略在肺癌中的应用。第二技术层比较三种不同输入模态的深度学习模型性能——仅使用平扫CT特征LUNAI-uCT模型、仅使用增强CT特征LUNAI-eCT模型以及融合两者特征的模型LUNAI-fCT模型。通过对比验证多模态信息融合是否能够显著提升预测性能并探索各模态特征对pCR预测的独立贡献。第三机制层探究深度学习模型所提取的影像特征是否能够反映与免疫化疗反应相关的生物学过程例如肿瘤内部异质性、坏死、血管通透性以及肿瘤边缘的免疫浸润状态。通过可解释性分析工具SHAP和Grad-CAM定位模型决策时所关注的肿瘤区域并将其与已知的肿瘤微环境生物学知识进行关联从而为影像特征的生物学意义提供初步证据。这一机制层面的探索是本研究区别于传统影像组学预测模型的核心创新点旨在推动影像生物标志物从“黑箱预测”走向“机制可解释”。04研究思路最核心怎么挂靠机制本研究的核心思路是通过深度学习提取多模态CT影像中的深层特征融合后构建预测模型并利用可解释性分析将模型决策与潜在的肿瘤生物学机制挂靠。具体流程如下首先研究者采用一个预先训练好的肺部CT基础模型FM-LCT该模型基于大规模、多样化的肺癌CT数据集使用掩码自编码器MAE对比学习算法训练而成能够提取出比传统方法更具泛化能力的影像特征。从每个患者的平扫CT和增强CT中分别提取肿瘤边界框内的深度特征向量长度768形成FS-uCT和FS-eCT特征集然后通过平均池化融合为FS-fCT特征集并利用主成分分析PCA降维至16个关键特征以避免过拟合。接着采用随机森林算法分别构建LUNAI-uCT、LUNAI-eCT和LUNAI-fCT三个预测模型输出一个名为Immu_TR免疫化疗治疗反应的连续评分用于量化pCR可能性。最关键的是机制挂靠设计一方面使用SHAP分析计算每个特征对预测的贡献度识别出最重要的影像特征另一方面采用Grad-CAM生成显著热力图可视化模型在平扫和增强CT上关注的肿瘤区域如瘤内、瘤周。通过观察这些区域与已知生物学过程如肿瘤中心坏死、边缘免疫浸润、血管丰富区的空间对应关系反推深度学习特征可能捕捉到的生物学信号。最后通过t-SNE和UMAP降维可视化验证特征空间中的pCR与非pCR分离程度并使用Kolmogorov-Smirnov检验比较Immu_TR得分在两组间的差异。整个思路实现了从影像到预测、从预测到定位、从定位到机制的层层递进。05数据和方法机制部分怎么设计数据本研究共纳入来自四个中心的225例接受新辅助免疫化疗后手术的NSCLC患者。其中Center A的113例作为训练与内部验证集按8:2随机划分为训练集和验证集用于模型开发与参数调优Center B73例、Center C20例和Center D19例共112例作为独立外部测试集用于评估模型的泛化性能。图 1患者筛选流程图方法CT图像预处理体素重采样至1mm等向、Z-score归一化→ROI分割肿瘤边界框→深度特征提取使用预训练的FM-LCT基础模型分别从平扫CT和增强CT提取768维特征向量→特征融合平均池化得到融合特征→PCA降维保留16个关键特征→随机森林建模构建LUNAI-uCT、LUNAI-eCT、LUNAI-fCT三个模型输出Immu_TR评分→模型评估AUC、准确率、灵敏度、特异度等→可解释性分析SHAP量化特征重要性Grad-CAM生成热力图定位关注区域。图 2整体研究设计示意图该图分为三部分a基础模型预训练采用掩码自编码器MAE在大规模肺癌CT数据集上训练FM-LCT模型使其能够提取具有生物学意义的深层特征b特征提取与建模分别从平扫CT和增强CT提取特征融合后构建LUNAI-uCT、LUNAI-eCT和LUNAI-fCT三个随机森林模型c定量分析与评估包括患者特征分析、模型性能评估以及影像特征分析。06研究结果“从表型到机制”①表型层面预测性能在独立外部测试集中单模态模型LUNAI-uCT和LUNAI-eCT的AUC分别为0.762和0.797而多模态融合模型LUNAI-fCT的AUC提升至0.86695% CI 0.821–0.883准确率达0.800。融合模型在灵敏度0.917、特异度0.739及NPV0.944上均优于单模态表明多模态CT信息互补可显著提升pCR预测能力。图 3预测模型的性能比较图3a展示了三个模型在测试集中的ROC曲线LUNAI-fCT的AUC达到0.866显著优于单模态模型图3b为混淆矩阵显示融合模型在平衡敏感性和特异性方面表现最佳图3c为亚组分析按年龄、吸烟状态、临床分期表明融合模型在各亚组中均保持稳定优势。从机制角度看融合模型性能的提升源于平扫CT捕捉肿瘤结构异质性如坏死、细胞密度与增强CT反映血管功能如灌注、免疫浸润的生物学信息互补从而更全面刻画肿瘤微环境状态。②特征层面机制线索融合模型输出的Immu_TR评分在pCR与非pCR组间的Kolmogorov-Smirnov统计量高达0.825p0.001显著高于平扫0.704和增强0.752单模态。t-SNE和UMAP可视化显示融合特征在二维空间中更清晰地将两组患者分离提示该特征集捕捉到了与免疫化疗反应密切相关的潜在生物学信号。图 4Immu_TR评分的统计分析与可视化图4a–c展示Kolmogorov-Smirnov检验融合模型的Immu_TR评分在pCR与非pCR组间差异最大KS0.825p0.001说明该评分能有效区分两类患者。图4d–f为t-SNE可视化图4g–i为UMAP可视化均显示融合特征在低维空间中将pCR与非pCR患者更清晰分离。这表明深度学习特征所捕捉的影像模式与肿瘤免疫清除能力密切相关即高Immu_TR评分可能反映了有利的肿瘤微环境如高免疫浸润、低异质性为影像特征作为生物学替代指标提供了证据。③可解释性层面机制定位SHAP分析表明特征2和14对融合模型预测贡献最大Grad-CAM热力图显示模型重点关注肿瘤内部及边缘区域。肿瘤内部可能反映细胞密度与坏死程度肿瘤边缘则提示免疫浸润和血管生成活性。这种空间定位为影像特征与肿瘤微环境生物学机制的关联提供了直观证据。图 5SHAP特征重要性分析该图分别展示了LUNAI-uCT图5a、LUNAI-eCT图5b和LUNAI-fCT图5c模型中各特征的SHAP值排序。在融合模型中特征2和特征14具有最高的绝对SHAP值是预测pCR的最强贡献因子。SHAP分析不仅量化了每个特征的影响方向正向或负向还揭示了不同模态特征之间的互补关系。从生物学角度看这些关键特征可能对应着肿瘤内部坏死区域的比例、边缘浸润带的纹理复杂度或增强扫描中造影剂异质性分布从而间接反映了免疫化疗的敏感性。图 6Grad-CAM热力图示例该图展示了两个临床特征相似但pCR结果不同的患者。患者ApCR的Immu_TR评分为0.791患者B非pCR为0.213。Grad-CAM热力图叠加在平扫CT和增强CT上显示模型重点关注肿瘤内部及肿瘤边缘区域。在pCR患者中热力集中在瘤内异质区和边缘带提示这些区域可能存在大量淋巴细胞浸润和有效的免疫清除而非pCR患者的热力更分散或集中在坏死中心暗示免疫逃逸或缺乏有效浸润。这一可视化直观地将模型决策与肿瘤微环境的生物学过程挂靠起来。07讨论把机制故事讲圆本研究的核心发现是融合平扫与增强CT的深度学习特征LUNAI-fCT模型能够以非侵入方式准确预测NSCLC患者新辅助免疫化疗后的pCR且其性能显著优于任一单模态模型。从生物学机制角度我们认为这种优势源于多模态CT信息互补性地刻画了肿瘤微环境TME的不同维度平扫CT主要反映肿瘤的固有物理属性如细胞密度、坏死区域和基质比例这些特征与肿瘤的内在异质性相关而增强CT则通过对比剂的分布模式间接评估肿瘤血管生成状态、血管通透性及灌注异质性这些功能指标与免疫细胞的招募和浸润效率密切相关。当两种信息融合后模型得以同时捕捉“肿瘤内部结构”和“肿瘤-宿主界面功能”两方面的信号从而更完整地表征TME的免疫状态。本研究的Grad-CAM热力图进一步支持了这一机制解释模型重点关注的两个区域——肿瘤内部和肿瘤边缘——恰好是免疫化疗发挥作用的“主战场”。肿瘤内部的坏死和缺氧区域可能影响药物渗透和免疫细胞活性而肿瘤边缘则是淋巴细胞浸润、免疫检查点分子表达和血管生成最活跃的部位。因此模型通过这两个区域的影像特征间接评估了免疫清除的可能性。此外本研究的Immu_TR评分作为连续变量在pCR与非pCR组间展现出显著差异KS0.825提示该评分可能作为TME免疫反应性的影像替代指标。尽管如此本研究仍存在局限性回顾性设计可能引入选择偏倚各中心样本量不均且较小缺乏与活检病理标志物如PD-L1表达、TMB的直接关联验证。未来需开展前瞻性研究并整合病理组学、基因组学等多模态数据以进一步验证影像特征与生物学机制之间的因果链。总体而言本研究成功地将深度学习影像特征与肿瘤免疫生物学机制进行了合理挂靠为非侵入性预测免疫化疗疗效提供了可解释的工具。08这篇文献的可借鉴思路这篇论文为影像组学研究如何从“黑箱预测”走向“机制可解释”提供了极具价值的范例以下思路可直接迁移到其他癌种或治疗场景中第一多模态影像融合策略。多数研究仅使用单一模态如增强CT或MRI而本研究证明平扫与增强模态的融合显著提升预测性能其背后的生物学逻辑是平扫反映结构异质性增强反映血管功能两者互补。类似地在乳腺癌新辅助化疗中可融合DCE-MRI与DWI在直肠癌新辅助放化疗中可融合T2WI与DCE-MRI分别捕捉细胞密度和微血管通透性。第二基础模型作为特征提取器。传统方法常在小样本上从头训练CNN易过拟合本研究采用预训练的FM-LCT模型基于MAE对比学习在大规模肺癌CT上训练仅用少量下游数据提取特征极大提升了泛化能力。这一思路适用于任何影像模态——只要存在大规模预训练模型如CT-Foundation、MRI-Foundation即可迁移学习。第三可解释性驱动的机制挂靠。本研究通过Grad-CAM定位关键区域肿瘤内部边缘再结合生物学知识坏死、免疫浸润、血管生成进行机制推测形成“影像特征→空间定位→生物过程”的逻辑链条。研究者可以在自己的任务中采用类似策略先可视化模型关注的区域然后查阅文献或开展实验验证该区域是否富集某种已知生物学过程如缺氧、增殖、免疫浸润。第四连续评分Immu_TR的设计。将二分类预测转化为连续评分不仅可用于风险分层还可与其他连续变量如突变丰度、免疫评分进行相关性分析增强机制解释力。第五多中心外部验证的布局。本研究将三个中心的数据作为测试集不同中心使用不同扫描参数但模型仍保持较高性能说明深度学习特征对技术差异具有鲁棒性。未来研究在设计之初就应预留至少一个独立外部测试集以证明模型的泛化能力和机制发现的普适性。第六特征降维与可解释性的平衡。本研究用PCA将768维特征降至16维既避免过拟合又使SHAP分析变得可行16个特征可逐一解释。降维后的特征可被反向映射到原始影像空间为后续生物学验证提供明确假设。综上所述“多模态融合基础模型迁移 Grad-CAM空间定位连续评分多中心验证”是一套可复制、可推广的范式能够帮助影像组学研究在提升预测精度的同时打开“黑箱”逐步揭示影像背后的生物学语言。09结语总而言之做影像组学不只是拼AUC、堆模型更要学会给特征找意义、给模型讲道理。这篇文献告诉我们多模态融合平扫增强之所以优于单模态是因为不同CT序列分别捕捉了肿瘤结构异质性与血管功能状态Grad-CAM热力图之所以有价值是因为它把模型的注意力定位到了肿瘤内部坏死、细胞密度和边缘免疫浸润这些生物学“主战场”Immu_TR评分之所以能成为生物标志物是因为它间接量化了肿瘤微环境的免疫清除能力。只有把宏观影像和微观机制真正打通我们的研究才不是“玄学算命”而是有根有据、有血有肉、能讲好疾病故事的真科研。希望大家以后都能少走弯路轻松写出有机制、有深度、能发高分的好文章参考文献Ye G, Wu G, Qi Y, Li K, Wang M, Zhang C, Li F, Wee L, Dekker A, Han C, Liu Z, Liao Y, Shi Z. Non-invasive multimodal CT deep learning biomarker to predict pathological complete response of non-small cell lung cancer following neoadjuvant immunochemotherapy: a multicenter study. J Immunother Cancer. 2024 Sep 3;12(9):e009348. doi: 10.1136/jitc-2024-009348.

如何将纵向CT影像组学特征与局部晚期胃癌化疗时空异质性及耐药演化建立关联，并进一步解释其与化疗响应、淋巴结转移及生存预后的机制联系

01导语各位同学，大家好。做影像组学最怕的就是模型精度高但讲不清道理——别人一问“你这个特征到底代表肿瘤的什么生物学行为？”瞬间就变成了黑箱。今天这篇文献给我们打了个样：它用纵向CT影像捕捉胃癌新辅助化疗后的肿瘤时空异质性&#xf…...

2026/5/2 2:14:43 阅读更多 →

智能体工作流编排：从DAG原理到Agent-Flow实战应用

1. 项目概述：从“Agent-Flow”看智能体工作流编排的演进最近在开源社区里，一个名为“patoles/agent-flow”的项目引起了我的注意。乍一看标题，你可能会觉得这又是一个关于AI智能体（Agent）的框架，但深入探究…...

2026/5/2 2:12:34 阅读更多 →

AI Agent成本监控工具agentcost-cli：精准追踪LLM API开销

1. 项目概述：一个为AI Agent开发者量身定制的成本监控利器如果你正在开发或使用基于大语言模型的AI Agent，无论是自动化客服、代码助手还是数据分析机器人，一个绕不开的“灵魂拷问”就是：这玩意儿跑一次到底花了多少钱&#xff1f…...

2026/5/2 2:05:48 阅读更多 →

AI智能体工作流编排：从单体架构到流水线协作的工程实践

1. 项目概述：当AI智能体学会“流水线”协作最近在探索AI智能体（Agent）的落地应用时，我遇到了一个非常有意思的项目：coleam00/ottomator-agents。这个名字本身就充满了想象力——“Ottomator”，听起来像是“…...

2026/4/30 13:50:50 阅读更多 →

ChatGPT翻译能力解析与实战技巧

1. ChatGPT翻译能力深度解析作为一名长期从事语言技术研究的从业者，我最近系统测试了ChatGPT在多语言翻译场景下的实际表现。与传统的机器翻译工具相比，ChatGPT展现出几个独特优势：首先，它的上下文理解能力远超传统翻译引擎。当处…...

2026/4/29 16:56:51 阅读更多 →

2026届毕业生推荐的十大降AI率助手实际效果

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在内容生产这个过程当中，要降低AIGC也就是人工智能生成内容所占的比例&#xff…...

2026/5/1 0:57:51 阅读更多 →