一家英国明星芯片公司“悄然”入华!叫板英伟达A100,设定中国为其最大市场

【一家英国明星芯片公司“悄然”入华!叫板英伟达A100,设定中国为其最大市场】“计算革命在计算机历史上只发生过三次 , 第一次是70年代的CPU , 第二次是90年代的GPU , 而Graphcore就是第三次革命 , 他们的芯片(IPU , 智能处理单元)是这个世界伟大新架构的一种 。 ”说这话的是ARM公司创始人、英国半导体之父赫尔曼·豪瑟(HermannHauser) 。 他口中的Graphcore , 是来自英国的AI芯片公司 。 这家公司创办于2016年 , 在芯片领域有着多年经验的奈杰尔·图恩(NigelToon)担任联合创始人和CEO , 曾创办过两家处理器公司的西蒙·诺尔斯(SimonKnowles)担任联合创始人和CTO 。
一家英国明星芯片公司“悄然”入华!叫板英伟达A100,设定中国为其最大市场
文章图片

图|Graphcore(来源:Graphcore)这家分公司遍布多个国家和地区的公司 , 于2019年进入中国 。 9月19日 , DeepTech和Graphcore高级副总裁兼中国区总经理卢涛 , 就相关问题进行了交流 。一家英国明星芯片公司“悄然”入华!叫板英伟达A100,设定中国为其最大市场
文章图片

图|卢涛(来源:Graphcore)他表示 , Graphcore的主要技术是以IPU处理器、为IPU打造的Poplar软件 。 基于IPU处理器和Poplar软件栈 , Graphcore的产品最后以用在IPU服务器中的PCIe卡、IPU系统产品IPU-Machine和IPU-POD的形式呈现给用户 。 Graphcore已经取得了一些阶段性进展 。 截止目前 , IPU已达到一万多片的发货规模 , 并服务于全球超过100家的机构 , 其主要应用在互联网大规模数据中心、高校和科研机构等 。 同时 , IPU也在支撑医疗、金融、生命科学、汽车、金融和计算领域方面的应用 。 2019年初 , AI教父杰夫·欣顿(GeoffHinton)在接受采访人员采访的时候 , 被问未来什么样的计算系统会更像大脑?他的回答是:“我认为我们需要转向不同类型的计算机 。 幸运的是 , 我这里有一个...”欣顿伸手进入他的钱包 , 拿出一个又大又亮的硅片——一个GraphcoreIPU芯片 。 IPU带来可持续发展路径2016年 , 全球AI产业进入高速发展阶段 。 在过去 , 大概每隔三个月 , 模型参数规模就会提高一倍 。 2018年10月 , 谷歌的ResNet模型有3.3亿个参数 。 2019年3月 , OPENAI的大型语言模型GPT-2达到15.5亿个参数 。 2020年 , GPT-3达到1750亿个参数 。 GPT-3模型完成一次完整训练 , 要耗费千万美金级别的花销 。 这样的密集计算 , 很难带来持续发展 。 那么 , 是否有可持续发展的路径?在论文《EfficientNet:对卷积神经网络的模型缩放的重新思考》(EfficientNet:RethinkingModelScalingforConvolutionalNeuralNetworks)中 , 论文作者通过平衡神经网络的深度、宽度、准确率 , 再通过找到平衡点、并把底层卷积改变之后 , 找到了大幅减小参数数量的方法 , 与此同时准确度也得到提升 。 卢涛认为 , 这是未来的代表方向之一 。 2020年上半年 , 微软机器学习科学家SujeethBharadwaj分享了IPU训练CXR模型的卓越性能 , IPU在运行微软COVID-19影像分析算法EfficientNet和SONIC时表现亮眼 , 在30分钟内完成了英伟达传统芯片需5个小时的训练工作量 。一家英国明星芯片公司“悄然”入华!叫板英伟达A100,设定中国为其最大市场
文章图片

图|微软用IPU和GPU训练用于新冠算法模型的对比从Graphcore的角度来看 , 不管是CPU还是GPU , 都不是针对AI应用而生 。 CPU是标量处理器 , 它主要做模拟性判断 , 用于帮助程序员针对固定模式进行编程 。 CPU特别适合的架构是通过大量的模拟处理器开发手机App和外包服务器 。 GPU是针对图像处理而生 , 相比CPU来说GPU在并行度和向量机上都有很大提升 。 概括来说 , GPU主要应用在主流AI平台 , 它并不是为AI而生的处理器 。 Graphcore进行大量分析后发现 , AI计算具有高度并行、低密度计算等特点 , 不管做图像处理模型、还是语言处理模型 , 都会在底层表达成一个计算图 。 卢涛认为 , 真正面向未来的AI处理器 , 必须是针对计算图来进行处理 , 而Graphcore的IPU正是以计算图为核心的智能处理器 。 三项变革性技术:计算、数据、通信进入中国后 , Graphcore一直努力接近开发者 , 卢涛在9月19日中关村论坛的演讲结尾 , 特意提到该公司在中文网站graphcore.cn、微信和知乎的开发者创新社区 , 并鼓励更多开发者来到上述平台 , 获取Graphcore的资源和支持来进行创新 。 对此做法 , 他解释称 , Graphcore希望将权利移交给创新者 。 那么 , 首先要给创新者提供新的平台 , 让他有新的可能性 。 如果开发者的算法不适合GPU , 并不一定代表你的算法无效 , 而是你需要一个新平台 。 基于此 , Graphcore提供了非常先进的AI处理器、以及大规模IPU集群系统 。 2020年7月15日 , Graphcore发布基于7nm的第二代IPU处理器——GC200 , 以及用于Mk2mIPU和IPU系统产品的技术:计算、数据、通信 。一家英国明星芯片公司“悄然”入华!叫板英伟达A100,设定中国为其最大市场
文章图片

图|GC200(来源:Graphcore)GC200基于台积电7nm工艺 , 有594亿个晶体管 , 是当前单一芯片最大规模的处理器 。 GC200仍然延续了第一代的“同构众核”架构 , 所不同的是 , 制造工艺从16nm , 提升为最新的7nm 。 GC200的处理器片上存储也从300MB提升到900MB , 晶体管数量超出英伟达2020年5月发布最新旗舰A100 。 GC200的处理器核心从上一代的1217提升到1472 , 能执行8832个单独的并行线程 , 系统性能提升8倍以上 。 在数据处理方面 , GC200延续之前的高带宽高容量表现 , 这对于应对一些复杂AI模型及算法很有帮助 , 官方表示它可支持具有数千亿个参数的最大模型 。 此外 , Graphcore还首次提出IPU-EXCHANGE-MEMORY , 这是一种交换式的储存架构 。 Graphcore在M2000每个IPU-Machine里面通过IPU-Exchange-Memory技术 , 提供了将近超过100倍的带宽以及大约10倍的容量 , 这对于很多复杂的AI模型算法是非常有帮助的 。 针对AI计算集群 , Graphcore打造了IPU-Fabric技术 , 这是为AI横向扩展而生的通信技术 , 它的优点是弹性大、低时延 。 有了IPU-Fabric之后 , 用户可以轻松构建出超低弹性的计算平台 。 M2000是Graphcore推出的基于GC200的刀片型服务器 , 每片能提供1PetaFlop的算力支持 。 M2000可以被看作是GraphcoreIPU系统产品部署的最小单元 , 基于它可以很方便地创建各种规模的集群 。一家英国明星芯片公司“悄然”入华!叫板英伟达A100,设定中国为其最大市场
文章图片

图|IPU-Fabric(来源:Graphcore)Graphcore协同IPU从零打造了一个以图为抽象编程模型的软件Poplar 。 通过这套软件SDK , 不管是使用浪潮还是戴尔的服务器 , 更或者是使用单个M2000以及大规模计算系统IPU-POD , Graphcore都能使用同一套软件进行编程 。 Graphcore还在Poplar层面上 , 提供了很多软件库 。 以神经网络库为例 , 其可以支持标准的PyTorch、TensorFlow与ONNX等 。 同时 , Graphcore认为 , 对一个系统而言 , 运维和管理也非常重要 。 为此 , Graphcore基于开源做了集群管理套件 。 在整个处理器研发过程中 , Graphcore认为开放非常重要 。 卢涛表示 , 开源是因为创新需要对底层有很多可见度 。 Graphcore认为要把权利移交给开发者 , 并于2020年7月开源了所有的计算图库源代码和机器学习算法模型 。 在构建社区方面 , Graphcore在金山云上构建了一个开发者云 , 其主要面向商业用户、高校、科研机构和个人研究者 。 卢涛表示 , 这一且都是为了帮助创新者 , 可以在在机器智能中实现下一波突破 , 以及帮助用户实现在CPU、GPU上没有办法实现的创新 。 Graphcore至今成立了四年多的时间 , 期间已得到红杉资本的支持 , 也获得了宝马、博世、微软、三星、DELL等企业的投资 。 经过几年的发展 , Graphcore已经发展为遍布全球的机构 。 对于加入中国 , 该公司创始人奈杰尔·图恩(NigelToon)表示:“有远见的中国公司已经开始着手布局自己在AI领域的蓝图 。 也许这就是为什么Graphcore在中国找到了热情 , 并如此深度的参与 。 Graphcore已经开始为一些颇有建树的中国公司提供技术支持 , 并将助力推动中国那些发展最快、最具创新性的AI初创企业 。 ”卢涛也对DeepTech表示 , 中国的企业非常擅长把创新进行大批量的快速落地部署 , Graphcore觉得中国是最大的市场之一 。 在快速落地部署中 , Graphcore也可以进一步打磨自己的产品 。 此外 , IPU也能帮助用户释放出更多潜能 , 今天在CPU和GPU上做不好的事情 , 在IPU上可能会释放极大潜力 。一家英国明星芯片公司“悄然”入华!叫板英伟达A100,设定中国为其最大市场
文章图片

-End-


    推荐阅读