机器之心|一文探讨可解释深度学习技术在医疗图像诊断中的应用( 三 )


基于反向传播的方法(Backpropagation based methods)是另外一种有效的属性方法 。 基于反向传播的方法会通过一次前向和后向网络传播过程来计算所有输入特征的属性 。 一些方法会多次执行这些步骤 , 这种方法与输入特征的数量无关 , 并且计算速度比基于扰动的方法要慢得多 。
由于具有良好的易用性 , 大多数研究可解释深度学习方法的医学影像学文献都使用的是属性方法 。 研究人员可以直接使用已有的属性模型训练得到一个合适的神经网络结构 , 这一过程不会增加计算复杂度 。 这使得人们可以直接使用预先得到的深度学习模型或具有定制体系结构的模型 , 以在给定任务上获得最佳性能 。 前者使这种实现过程更容易 , 并可以方便的引入诸如转移学习之类的技术 , 而后者可用于专门处理特定数据 , 并通过使用较少的参数避免过度拟合 。 引入属性方法可以有效展示出原有的深度学习模型是否能够学习相关有意义的特征 , 或者是否是通过学习伪特征来过度适应输入的 。 这使得研究人员可以调整模型结构和超参数 , 从而在测试数据上获得更好的结果 , 进而得到潜在的真实场景中的设置 。
1.2.2 非属性方法
非属性方法是指针对给定的专门问题开发并验证一种可解释性方法 , 而不是像属性方法那样进行单独的分析 。 非属性方法包括注意力图(Attention maps)、概念向量(Concept vectors)、相似图像(Similar image)、文本证明(text justification)、专家知识(expert knowledge)、内在解释性(Intrinsic explainability)等 。
注意力是深度学习中一个非常有用的概念 , 是由人类对图像的不同部分或其它类型数据源的注意方式的不同所启发产生的 。 非属性方法中用到的注意力的主要是作为可解释的医学图像分析的深度学习工具 。 如文献 [4] 提出了一种新的测试概念激活向量(Testing Concept Activation Vectors , TCAV)方法 , 用人类可理解的概念向领域专家解释不同层次学习的特征 。 TCVA 把网络在概念空间中的方向导数作为显著图(Saliency Maps) 。 使用显著图来解释糖尿病性视网膜病变(diabetic retinopathy , DR)水平的预测 , 能够成功检测到视网膜中存在的微动脉瘤和动脉瘤 。 这就为医生提供了一个可解释的理由 , 即图像中是否存在给定的概念或物理结构 。 然而 , 许多医学中的临床概念(Clinical Concept) , 如结构纹理或组织形状等 , 并不能直接使用 TCAV 进行充分描述以证明其存在或不存在 , 此时就需要引入连续的测量指标进行辅助判断 。
基于专家知识的非属性方法主要有两种:一是 , 使用不同的方法将模型特征与专家知识关联起来;二是 , 使用特定领域的知识来制定用于预测和解释的规则 。 基于相似图像的非属性方法为用户提供了类似标签的图像作为对给定测试图像进行预测的原因解释 。 文本证明方法使用一个给定推理后能够根据句子或短语来解释其决策的模型 , 该模型可以直接与专家和一般用户进行交流 。 例如 , 从分类器的视觉特征以及嵌入预测中获取输入的证明模型可以被用于生成乳腺肿块分类的诊断语句和可视化热图[5] 。 内在解释性是指模型具有根据人类可观察到的决策边界或特征来解释其决策的能力 。 一些相对简单的模型 , 如回归模型、决策树和支持向量机等 , 都是可以观察到决策边界的 , 因此是具备内在解释性的 。 最近的关于内在解释性的研究使用不同的方法使深度学习模型本质上可解释 , 例如混合使用机器学习分类器和在分割空间中的可视化特征等 。
二、属性方法在医疗图像分析中的应用
2.1、可视化卷积神经网络改善皮肤病变分类的决策支持[6]
机器之心|一文探讨可解释深度学习技术在医疗图像诊断中的应用
本文插图

本文提出了一种属性方法用于实现可解释 CNN 在医疗图像诊断中的应用 。 该方法训练得到了一个 CNN 用于在皮肤损伤数据库上进行二元分类 , 并通过可视化其特征图来检验 CNN 学习的特征 。 作者通过对不同特征图的可视化对比分析 , 确定输入特征对最终 CNN 目标神经元的贡献 。


推荐阅读