华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器

华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器
原创机器之心Pro2020-05-0612:54:57
机器之心报道
参与:Racoon、蛋酱、张倩
终于等到了这个交互式学习神器 , 把CNN的工作过程画得明明白白 , 帮助萌新轻松入门 。
华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器
文章图片
什么是CNN?ConvolutionalNeuralNetwork , 中文译为「卷积神经网络」 。
这个常见但有些深奥的词汇 , 只可意会 , 不能言传 。 如果打开教材 , 会看到这样一些解释:
卷积层是深度神经网络在处理图像时十分常用的一种层 。 当一个深度神经网络以卷积层为主体时 , 我们也称之为卷积神经网络 。
神经网络中的卷积层就是用卷积运算对原始图像或者上一层的特征进行变换的层……
说得很有道理 , 但如果将一张图片作为输入 , 这张图片究竟会在卷积神经网络中经历什么?这可真是太考验想象力了 。
最近 , 来自佐治亚理工学院与俄勒冈州立大学的研究者们 , 考虑到初学者和非专业人士的学习痛点 , 合作开发出了一款卷积神经网络交互式可视化工具——CNN解释器(CNNExplainer) 。 这个解释器展示了一个10层的神经网络 , 包含卷积层、激活函数、池化层等多个CNN初学者无论如何也绕不开的概念 。
华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器
文章图片
这个工具到底把CNN展示得有多明白?简单来说 , 项目作者已经给你做好了一个可以交互的界面 , 各种层、激活函数都铺在眼前 。 你只需要打开浏览器加载出这个界面 , 移动鼠标点来点去就可以了 。
华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器
文章图片
CNNExplainer使用TensorFlow.js加载预训练模型进行可视化效果 , 交互方面则使用Svelte作为框架并使用D3.js进行可视化 。 最终的成品即使对于完全不懂的新手来说 , 也没有使用门槛 。 下面我们来看一下具体的效果 。
卷积层
既然是卷积网络 , 我们就先来看一下卷积层是怎么工作的 。 卷积层包含学习的卷积核 , 可以提取出每张图像独有的特征 , 因此是CNN的基础 。
当你与卷积层进行交互的时候 , 前面的层与卷积层之间会出现很多连线 , 其中的每条线都代表一个独特的卷积核 。 这些卷积核用于卷积运算 , 以生成当前卷积神经元的输出或激活图 。
以交互图中的TinyVGG架构为例 。 可以看到 , 它的第一个卷积层有10个神经元 , 但前一层只有3个神经元 。 聚焦于第一个卷积层顶端卷积神经元的输出 , 如果我们将鼠标悬停在激活图上 , 就可以看到这里有3个独特的卷积核 。
华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器
文章图片
图1:如果将鼠标悬停在第一个卷积层最前面的激活图上 , 就可以看到此处应用了3个卷积核来得到此激活图 。 点击此激活图 , 可以看到每个卷积核都进行了卷积运算 。
华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器
文章图片
图2:用来生成上述激活图顶端中间结果的卷积核 。
激活函数
ReLU
ReLu是CNN中的非常常用的一种非线性激活函数 , 可以加快CNN的训练速度 。 它是一种一对一的数学运算:
华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器
文章图片
点击交互图中的ReLU神经元就能观察到这个激活函数是如何工作的:
华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器
文章图片
Softmax
【华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器】在卷积神经网络中 , Softmax函数通常用于分类模型输出 。 在这个CNN解释器里 , 点击最后一层 , 即可显示网络中的Softmax运算过程:
华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器
文章图片
在Softmax的这部分视图中 , 用户可以体验不同颜色的logit和公式交互 , 从而了解在Flatten层之后 , 预测分数是如何归一化从而产生分类结果的 。
池化层
不同的CNN架构有很多不同类型的池化层 , 但它们的目的都是逐渐缩小网络的空间范围 , 从而降低网络的参数量和整体计算量 。
这个交互图里使用的池化类型是Max-Pooling , 其过程可以通过点击图中的池化神经元来观察:
华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器
文章图片
Flatten层
这一层将网络中一个三维的层转变为一个一维向量 , 之后将其输入到全连接层用于分类 。 因为用于分类的softmax函数需要一维向量作为输入(此处不包括batch维) , 因此需要用到Flatten层 。
通过点击任意一个输出类别可查看该层是如何工作的 。
作者简介
这个贴心的项目出自佐治亚理工和俄勒冈州立大学的研究者之手 。 其中 , 一作是该校的机器学习博士生ZijieWang 。 他的研究兴趣是机器学习的可解释性、公平性、安全性和可视化分析 。
华人博士卷积网络可视化项目火了:点鼠标就能看懂的扫盲神器
文章图片


    推荐阅读