谷歌做手写数字分类准确率才41.27%?对,不过是用量子计算做的


【谷歌做手写数字分类准确率才41.27%?对,不过是用量子计算做的】机器之心报道
机器之心编辑部
用神经网络做 MNIST 手写数字识别是机器学习小白用来练手的入门项目 , 业内最佳准确率已经达到了 99.84% 。 但最近 , 谷歌向这个「古老」的数据集发起了一项新的挑战:用量子计算来进行识别 , 看看准确率能达到多少 。
谷歌做手写数字分类准确率才41.27%?对,不过是用量子计算做的
本文插图
MNIST 对于机器学习研究者来说再熟悉不过了 , 它是一个由 Yann Lecun 等人创建的手写数字图像数据集 , 包含训练集和测试集 , 训练集包含 60000 个样本 , 测试集包含 10000 个样本(在 2019 年又增加了 50000 个测试集样本) 。
谷歌做手写数字分类准确率才41.27%?对,不过是用量子计算做的
本文插图
在机器学习研究中 , MNIST 手写数字图像数据集已经作为基准使用了二十余年 , 它可以说是所有机器学习研究者的入门必备 。 对于新兴方法的研究来说 , 从 MNIST 开始也是最合理的选择 , 2017 年 Geoffrey Hinton 提出的胶囊网络(Capsule Networks)也是这样做的 。
目前 , 大部分深度学习模型在 MNIST 上的分类精度都超过了 95% 。 有时为了更直观地观察算法之间的差异 , 我们会使用图像内容更加复杂的 Fashion-MNIST 数据集 。
在准确率已经如此之高的情况下 , 用神经网络向此数据集发起挑战已经没有多大意义 。 于是 , 谷歌索性换了一个思路:用量子计算技术来挑战一下 , 看看分类准确率能达到多少 。
实验结果表明 , 用量子计算技术可以在 MNIST 数据集上至少实现 41.27% 的分类准确率 , 而之前的经典方法只能达到 21.27% 。
为什么要这么做?
在现代科技中 , 量子力学和机器学习都发挥着重要作用 , 量子计算的 AI 应用这一新兴领域很有可能帮助许多学科实现重大突破 。 然而 , 目前大多数机器学习从业者对量子力学还没有透彻的了解 , 多数量子物理学家对机器学习的理解也非常有限 。 因此 , 找到一些二者都能理解的问题非常重要 , 这些问题既要包含简单且被广泛理解的机器学习思想 , 也要包含类似的量子力学思想 。
基于以上考量 , 谷歌的研究者提出用简单的量子力学知识解决一种简单的机器学习问题——MNIST 手写数字分类 。 这有点类似于谷歌的 TensorFlow Playground 。 TensorFlow Playground 本质上就是一种教学辅助 , 目的是向大众阐明深度学习的关键概念 。
研究细节
具体来说 , 研究者想要探究的是:在一个普通的图像分类问题中 , 如果你必须在通过一个 filter(可以显示来自测试集的示例图像)的第一个光量子(光子)之后做出决定 , 最高准确率能达到多少?在 MNIST 手写数字数据集上(28×28 像素) , 最佳经典方法是检测落在其中某个像素上的光子 , 然后使用在训练集上观察到的 per-pixel 概率(即光强度)分布来选择最有可能的数字类别 。 这需要将每个示例图像的亮度缩放到一个单位和(unit sum) , 以获得一个概率分布 。 在 MNIST 数据集上 , 上述经典方法可以实现 21.27% 的分类准确率 , 大大高于随机结果(10%) 。 每个像素最有可能的数字类别如下图 2(b)所示 。

谷歌做手写数字分类准确率才41.27%?对,不过是用量子计算做的
本文插图
如果可以将学习到的转换应用到图像和检测器之间的光子的量子态 , 我们就能利用量子力学实现更高的准确率 。 分束器和移相器等无源线性光学器件(passive linear optical element)可以用来解决这一问题 , 它们可以产生一种全息图式的干涉图样 。 接下来 , 根据第一个光子落在哪一个区域来进行最大似然估计 。 这说明了一种量子原理:单个量子的概率振幅与自身发生干涉 。 此处没有必要同时用许多光子照亮一个场景来产生干涉 。


推荐阅读