机器之心|一文探讨可解释深度学习技术在医疗图像诊断中的应用( 五 )


机器之心|一文探讨可解释深度学习技术在医疗图像诊断中的应用
本文插图

图 5. 各种图像伪造影的高激活特征图 , 从左到右 , 镜面反射、凝胶处理和标尺 , 这些伪造影可能会对 CNN 的输出造成偏差
最后 , 通过特征图 , 图 6 给出了对不同图像上激活的全面概述 。
机器之心|一文探讨可解释深度学习技术在医疗图像诊断中的应用
本文插图

图 6. 特征图总览
2.1.2 文章小结
本文分析了由 CNN 学习到的皮肤病医学图像中的特征 , 该 CNN 是为皮肤病变分类而训练得到的 。 通过可视化 CNN 的特征图可以看到 , 高级卷积层在与皮肤科医生所使用的类似的概念中具有较高激活度 , 例如病变边界、病变内的暗区、周围皮肤等 。 此外 , 作者还发现 , 一些特征图在各种图像伪造影区域具有较高激活度 , 如镜面反射、凝胶涂抹应用和标尺 。
尽管本文对 CNN 学习到的特征给出了一些分析和评论 , 但并不能解释 CNN 检测到的特征与其输出之间的任何因果关系 。 此外 , 通过特征图 , 并没有发现任何能精确突出皮肤科医生扫描过程中重点关注的其他结构 , 如球状体、圆点、血管结构等 。 作者认为 , 为了使 CNN 能够成为皮肤科医生更好的决策支持工具 , 还需要在这一领域进行更多的研究 。
三、非属性方法在医疗图像分析中的应用
3.1、通过深度生成模型学习可解释的解剖学特征:在心脏重构中的应用[7]
机器之心|一文探讨可解释深度学习技术在医疗图像诊断中的应用
本文插图

心脏几何结构和功能的改变是引发心血管疾病的常见原因 。 然而 , 目前的心血管疾病诊断方法往往依赖于人的主观评估以及医学图像的人工分析 。 近年来 , 深度学习方法在医学图像的分类或分割等任务中应用取得了成功 , 但在特征提取和决策过程中仍然缺乏可解释性 , 这就限制了深度学习方法在临床诊断中的价值 。
本文提出了一个三维卷积变分自动编码器(VAE)模型用于心脏病患者的医疗图像分类 。 该模型利用了从 3D 分割中学习到的可解释的任务相关解剖学模式(Anatomic Pattern) , 此外 , 还允许在图像的原始输入空间中可视化和量化所学习到的病理学特定重构模式 。
3.1.1 模型分析
本文所提出模型的示意图如图 1 所示 。 输入 X 为双通道输入的受试者在舒张末期(End-diastolic , ED)和收缩末期(end-systolic , ES)的三维左室心肌节段(3D left ventricular myocardial segmentations) 。 利用三维卷积 VAE , 通过编码器网络学习潜在空间中代表输入分段 X 的 d 维概率分布 , 并将该潜在分布参数化为 d 维正态分布 N(μ_i, σ_i) , 其中 , μ_ i 表示平均值 , σ_i 为标准差 。 在训练过程中 , 解码器网络通过从学习到的潜在 d 维流形中采样向量 z 来学习重建输入 X 的近似值 。 同时 , 一个由多层感知器(MLP)构成的判别网络(在本文中称为预测网络 prediction)被连接到平均向量μ上 , 并被训练用于区分健康志愿者(healthy volunteers , HVols)和肥厚型心肌病(hypertrophic cardiomyopathy , HCM)受试者 。 使用下述损失函数进行端到端训练:
其中 , L_rec 表示重建损失 , 可以通过输入 X 和重建之间的 Sorensen Dice 损失来计算得到 L_rec 。 L_KL 是 Kullback-Leibler 散度损失 , 其目的是使 N(μ, σ)尽可能接近其先前的分布 N(0, 1) 。 L_MLP 是 MLP 分类任务的交叉熵损失 。 潜在空间维数为 d=64 。
在测试阶段 , 通过将预测得到的μ传递到 z(不从潜在空间采样)来重建每个输入分段 , 最后 , 在训练阶段完成分类任务 。
机器之心|一文探讨可解释深度学习技术在医疗图像诊断中的应用


推荐阅读