给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事


刚刚过去的 8 月 , 由 IEEE 主办的第 32 届 Hot Chips 成功落幕 , 光计算创业公司 Lightmatter 展示的 AI 推理专用光子芯片——Mars , 作为压轴大戏 , 给观众留下了极为深刻的印象 。
Lightmatter 表示 , 在相同的芯片面积下 , 光子芯片的时延是电子芯片的千分之一 , 能耗是电子芯片的千分之一 , 工作频率是后者的十倍 。
给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事
本文插图

图 | Lightmatter 公开资料(DeepTech 整理)
并且 , Lightmatter 对媒体表示 , 将于明年秋季推出商用产品 。
显然 , 这次不是又一个 “狼来了” 的故事 , 光子芯片是真的来了 。
那么 , 光子芯片是什么?光子芯片能做什么?是否可以用在我们的笔记本电脑上?为了搞清楚这些问题 , DeepTech 联系到与 Lightmatter 共同领跑这一领域的曦智科技(Lightelligence)创始人兼 CEO 沈亦晨 。
有趣的是 , 这两家公司均于 2017 年 9 月成立 , 并且它们的 CEO 都出身麻省理工学院 , 更为巧合的是 , 2017 年他们分别以一作、二作的身份 , 在顶级期刊 Nature Photonics 发表了将光计算应用于人工智能领域的关键论文 。
诸多共同点的背后 , 隐藏着怎样的故事?
有媒体称 “光子芯片较电子芯片快 1000 倍” , “我个人认为这个说法并不准确 。 ” 沈亦晨说 。

首先 , 达成 1000 倍的约束条件很重要 。 如果仅就光子的纯计算部分 , 从光已经转换成光信号起 , 到完成计算止 , 这个过程所花的时间 , 说光子芯片较电子芯片快 1000 倍 , 倒不为过 。
但如果计算整个光子计算机系统所需要的时间 , 那么就要加上光电转换、数模转换以及内存和数字电路所花费的时间 , 肯定是达不到 1000 倍的 。
其次 , 在不同的应用、算法环境下 , 所得到的结果是不同的 。 未来随着越来越多的光部件渗入到电子计算机之中 , 光子计算机整体的速率会超过电子计算机越来越多 。
根据沈亦晨的判断 , “在短期之内 , 光子计算机与电子计算机基于通用 Benchmark , 在相同的节点之下 , 前者领先后者5 到 10 倍是非常合理的数字 。 对于特定的问题 , 比如退火算法等 , 现有的硬件条件已经可以做到百倍速率的提升 。 1000 倍可能是光子计算机提升的上限 , 需要把光的存储之类问题全部解决才可能达到 。 ”
但毫无疑问 , 光子芯片将在能耗、通量和延时 , 三个层面超越以 Intel 为代表的传统电子芯片 , 沈亦晨笃定地说 。
Lightmatter 光子芯片的基础计算单元被称作 MZI 。

这是一种光干涉仪 , 可以用来观测从单独光源发射的光束分裂成两道准直光束之后 , 经过不同路径与介质所产生的相对相移变化 , MZI 为英文缩写 。
给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事
本文插图

【给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事】图 | 马赫-曾德尔干涉仪时常用于空气动力学、等离子物理学与传热学领域 , 可以测量气体的压强、密度和温度的变化 。 在本图里 , 设想分析一支蜡烛的火焰 。 两种输出影像都可以被观测到 , 一个显示出白色火焰 , 另一个显示出黑色火焰(来源:维基百科)
这个构想最早产生于 1891 年 , 一百多年后的今天 , 它已经变成了下图的样子 。
给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事
本文插图

图 | MZI 实物图(来源:曦智科技)
Lightmatter 的芯片实际上由两个垂直堆叠的芯片组成 。 顶部是一个 50 平方毫米的 12nm 工艺 ASIC , 用于存储内存并协调控制位于下面的 150 平方毫米的 90nm 工艺光计算芯片 , 布线距离不超过 1 毫米 。 两个核芯均采用格芯代工 , 使用标准 CMOS 工艺制造 。
给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事
本文插图

图 | Lightmatter Mars 芯片结构图(来源:Lightmatter)

本次演示的 Mars 光计算芯片的工作频率为 1 GHz , 由 64x64 矩阵 64 个维度向量组成光矩阵乘法器 , 数据在不到 200 皮秒的时间内传播到整个芯片 , 整个核心由 50 毫瓦的激光发射器驱动 。
在一次计算过程中 , DAC(数字模拟转换器)接收数字输入信号 , 将其转换为模拟电压 , 并使用该电压来驱动激光器(该技术已在光纤发送器中广泛使用) 。
来自该激光器的光进入计算阵列 , 这里的基础计算单元就是 MZI 。 进入 MZI 的相干光分为两部分 , 每半部分的相位调整不同 。 将具有不同相位的信号组合会导致相长或相消干涉 , 从而有效地调节通过 MZI 的光的亮度 , 该调节可被视为乘法运算 。
在波导管(可理解为承载光的“电线”)相遇的地方 , 信号被有效地加在一起 。 这是光 MAC(Multiply-accumulate 乘积累加)的基础 , 最终计算阵列输出的光到达光电二极管 , 完成相应的计算 。
给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事
本文插图

图 | Lightmatter Mars 光学计算过程(来源:Lightmatter)
Lightmatter 的研发人员说道 , 这些元器件的损耗极低 , 静态功耗几乎为零 , 且几乎不会产生 “电子泄漏” 现象 。

曦智科技的基础计算单元 , 也使用 MZI , 但是在 MZI 的结构及 MZI 阵列的架构上 , 都采用了与 Lightmatter 不同的方式 。
MZI 的计算原理可以通俗地解释为 , 它有两条“手臂” , 通过某种方式改变了两条手臂的光程 , 以此来改变光通过两条手臂之后相互干涉的结果 。
给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事
本文插图

图 | MZI 矩阵乘法原理图(来源:Lightmatter)
Lightmatter 采用的是名为 NOEMS(Nano Optical Electro Mechanical System)的方案 , 这是一种机械式元件 , 原理是通过施加电压 , 让两条手臂在静电的作用下产生机械形变 , 以此改变手臂的物理长度 。
曦智使用的是电驱动式的 MZI , 具体做法是通过在两条手臂之中加入电子 , 在改变了电子密度的同时 , 也改变了光的介电常数 , 以此来改变光程 。
而电子的移动速度 , 是远远快于两条手臂的物理形变速度的 , 所以曦智的调制频率(reprogram)可以达到几十个 GHz , 而 Lightmatter 只能到 100MHz , 前者高出两个数量级 。
“当然 , 曦智的方式也并非完美 , 但我们在我们认为重要的部分做了取舍 。 ”沈亦晨说 。

“我不对 Lightmatter 的方案进行好坏的评价 , 但我个人认为他们的方案是一个非常大胆的尝试 。 当看到他们在网上公开的技术架构之后 , 我们的第一反应是对工艺和封装的改动太大了 , 这条路可能会比较坎坷” 。 他补充道 。
根据 Lightmatter 曝光给外界的 PPT 来看 , 他们的光子芯片架构是将所有的 MZI 连接到了一起 , 有点像三国赤壁之战中曹操的铁索连舟 。
给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事
本文插图

图 | Lightmatter 的光子芯片架构(来源:Lightmatter)
“这样的结构之下 , 一旦单个 MZI 节点出现问题 , 可能整个系统都会受到影响 。 而我们的架构中 , 因为实现光计算的原理不同 , 所以并不需要将所有的 MZI 直接相连 , 因此具有更强的容错性 。 ”
“我可以理解 Lightmatter 为什么选择这样一种方案 , 因为以他们光计算的原理、架构来说 , 机械式很可能是一个最优的选择 。 但这样的方案接下来要面临的就是产业成熟度 , 以及对于环境的敏感性等这些在产品和工程上的挑战 。 ”
去年 2 月 , 曦智已经做出了第一款产品雏形 , DeepTech 此前也有报道《用光挑战 “世界 7 大数学难题” 之首 , 麻省理工团队再证光学计算潜力》 。

给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事
本文插图

图 | 曦智科技光子芯片原型版卡
“经过一年多的研发改良 , 我们手上已经有了较之前领先得多的芯片 。 ”沈亦晨自信地说 。
在使用环境方面 , 曦智的光子芯片并不会比电子计算机有更严格的要求 , 在芯片内封闭的环境中 , 很少有外界手段能影响到光的运行 , 这方面反而电子更容易受到外界的影响而产生串扰 。
和电信号相比 , 光信号基本不受电磁干扰 。 所以 , 在信号传播距离超过 1 到 2 毫米的情况下 , 维持电信号信噪比所需的能耗会很快超过光电转换带来的额外能耗 。
一些来自外界的震动 , 也基本不会对曦智的光子芯片产生影响 , 因为他们采用的是 全固态结构 , 没有任何的机械活动部分 。 “反而 Lightmatter 的机械式 MZI 可能会受此影响 , 当然这是我的个人推测 。 ”沈亦晨如此说 。
曦智的芯片包含了数万个基础光子器件 , 光电信号转换的效率大概是 0.1~1 pj/bit , 激光发射器采用同光通讯一样的设备 , 在这方面的相关技术已经非常成熟 。

当 DeepTech 问及光子芯片的发布时间 , 沈亦晨表示 , 目前曦智已经可以作出非常明确的时间安排 , 但是暂时还是希望保持一定的神秘感 。 他补充道 , 这将是一个很近的时间节点 , 肯定会在一年之内 。
据悉 , 未来曦智光子芯片将以板卡及服务器的方式推出 , 同时也会以授权的方式向电子芯片设计厂商提供光子芯片的 IP , 以此来提升现有产品的性能 。 “我们的供应商全都是世界一流的大厂 , 而且供应链也已经打通 。 ”
给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事
本文插图

图 | 曦智科技原型光子芯片效果图(来源:曦智科技)
沈亦晨补充道 , 曦智的光子芯片前期将倾向用于 AI 推理芯片 , 后续会研发 AI 训练芯片 , 同时也会在几个非典型 AI 的应用场景 , 如药物研发、材料研发、量子模拟方向、超算方向等领域推出对应的产品 。
“我们的产品适用于各种公有、私有云服务及终端服务器 。 此外 , 可用于超算及矿机的光子芯片产品也已经处于筹备当中 , 但这些绝不是曦智的第一款产品 。 ”沈亦晨强调 。
光子芯片由于其基本的运作原理 , 非常适合于做矩阵乘法 , 尤其是稠密的、高并发式的计算 。 而这恰恰是人工智能神经网络所需要的 。

除此之外 , 光子芯片在片上传输方面的优势也很大 , 如:传统计算机内存到计算单元的数据搬运 , 以及计算单元之间的搬运 。
沈亦晨说 , 利用这一点 , 一方面可以据此推出自有的光子芯片 , 另一方面传统计算机也可以使用光计算技术对芯片进行改造 。 其效果就像是把古人的驿站 , 替换成现在的高铁 。
“我们的技术可以帮助 Intel、NVIDIA 等巨头升级它的芯片 , 而非单纯地取代 。 严格来讲 , 曦智的初代光子芯片属于光电混合芯片 , 也可以理解为协处理芯片 , 并没有完全将传统的集成电路抛弃 。 ”
目前 , 在光子芯片这个赛道 , 曦智科技与 Lightmatter , 已经成为了事实的领跑者 , 谁先行发布量产的光子芯片 , 谁就可以赢得先发优势 。 而在公司的背后 , 也同样是沈亦晨与 Lightmatter 创始人兼 CEO 尼古拉斯 · 哈里斯(Nicholas Harris)之间的竞争 。
这两位同样天才的年轻博士 , 因同一篇论文而开始了同样的事业 。
给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事
本文插图

图 | 沈亦晨与 Harris 合作的论文
给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事
本文插图

图 | 该论文登上了当期的 Nature 子刊封面
给力小青年|光子计算领域双雄出现!一篇顶刊论文,两位MIT天才的故事
本文插图

图 | 沈亦晨与 Harris 在麻省理工学院的创业大赛中获得 10 万美元奖金 , 他们一左一右共同举起了象征奖金的广告板
沈亦晨对这段往事并不想多谈 , 他只是说:“共同写作一篇 Paper 很简单 , 长不过一两年 , 但是共同创业可能是三五年、十年甚至是一辈子的事情 , 我们只是各自寻找了合适自己的团队、合作伙伴和投资人 。 ”
想到未来 , 沈亦晨的眼神微光闪动 。


    推荐阅读