News Release

生成式AI重塑医疗影像:从底层技术到临床全流程的变革之路

Peer-Reviewed Publication

Research

图1:医学影像在临床工作流程中的挑战

image: 图1:医学影像在临床工作流程中的挑战 view more 

Credit: Copyright © 2025 Shanshan Wang et al.

01研究背景:医疗影像的“数据孤岛”与“质量瓶颈”

医疗影像是现代医学的基石,贯穿于疾病筛查、诊断、治疗规划及预后评估的全过程。然而,在实际临床应用中,医生和科研人员常面临多重挑战:

· 数据稀缺与异质性: 高质量、可用且带标注的医学图像获取困难;不同中心、不同设备与不同协议导致数据标准不一、分布差异显著。

· 成像质量与成本的博弈: 为了降低辐射剂量、缩短扫描时间或减少采样,常常不得不牺牲图像质量,带来噪声、伪影与细节丢失,影响诊断可靠性。

· 纵向数据缺口 长期随访影像往往不连续、不完整,难以支撑疾病进程预测与疗效动态评估。

这些限制共同指向一个需求:需要能补齐缺失、统一异质、增强质量的生成式模型,来支撑更可靠的影像分析与临床决策。

02全谱系技术梳理

近十年,生成式AI快速演进:从GAN到VAE,从扩散模型到Transformer/Mamba等序列建模架构,再到新兴的多模态基础模型(Foundation Models)。它们不再只是“生成好看的图像”,而是逐步具备对医学影像分布进行建模、补全缺失信息、提升图像质量、跨模态翻译乃至模拟时空变化的能力,为医疗影像打开新的技术空间。

文章对主流技术架构进行了“全景式回顾”:既覆盖经典方法的核心思想与适用边界,也重点剖析了相关技术在不同任务的优缺点。

03构建临床全流程应用图谱

与以往按模型类别罗列不同,这篇综述的一大亮点,是将生成式模型的能力放回临床流程中重新组织,构建出清晰的“全流程应用图谱”:从成像——诊断——治疗——预后

这意味着生成式AI的价值不再局限于“补数据”,而是在全链条上帮助临床回答更直接的问题:

看得更清:在低剂量、快速或稀疏采样条件下恢复细节、提升可读性;

看得更全:实现MRI<—>CT、PET<—>MRI等跨模态补全,减少因检查条件受限带来的信息缺口;

看得更快:在时间敏感场景(急诊、术中、放疗适配)推动更接近实时的影像更新;

看得更远:用纵向生成建模模拟肿瘤生长、神经退行进展等,为个体化随访与治疗策略提供“可推演的影像证据”。

04从“像不像”到“有用吗”的三层评价体系

生成式模型在医疗影像里最难的,往往不是“能生成”,而是“能否可靠用于临床”。传统像素指标(如PSNR/SSIM)常常难以反映解剖合理性与临床可用性,也使不同方法之间难以公平对比。为此,论文提出面向临床转化的三层级评价框架:

像素层:衡量基础图像质量与结构保真;

特征/分布层:评估语义一致性与分布对齐,并引入图文一致性等思路辅助发现“幻觉”;

临床层:通过专家评阅与下游任务表现,验证生成结果是否真正提升诊断、分割、预测等临床相关任务。

05 挑战与边界:可信、泛化、算力与治理

论文也明确指出,生成式AI要进入临床常规工作流,还必须跨越几道门槛:

幻觉与黑箱:可能生成不存在的病灶或细节,且难以解释,带来临床风险;

泛化与偏倚:跨机构、跨设备、跨人群性能下滑,甚至放大医疗不公平;

算力与实时性:高分辨率/3D模型训练部署成本高,影响临床可扩展性;

监管与伦理:高风险医疗AI需要透明、可追溯、有人类监督,责任划分与合成数据的合规使用仍在演进中。

06 面向未来:从基础模型走向“世界模型/数字孪生”

更值得期待的是,论文提出了清晰趋势:未来发展将从当前基础模型进一步走向“世界模型/数字孪生”——不仅生成图像,更能在可解释、可控框架下模拟生理过程与个体化疾病轨迹;并通过融合影像+文本+组学等多模态信息,形成更完整的个体画像。

要实现这一愿景,关键方向包括:提升跨域鲁棒性、推进不确定性量化与幻觉检测、引入解剖/生理先验增强可解释性、优化高效推理以支持实时临床场景,并建立更标准化、可治理的评价与部署体系。

原文链接:https://spj.science.org/doi/10.34133/research.1029


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.