谷歌|为AI而生的IPU芯片,或挑战GPU的霸主位?( 二 )
近几年 , 全球已经有上百家公司投入到新型AI芯片的研发和设计当中 , 当然最终能够成功流片并推出商用的仍然是几家巨头公司和少数实力雄厚的独角兽公司 。
这其中 , 2017年初创成立的Graphcore所研发的AI芯片IPU , 则成为这些AI芯片当中的另类代表 , 因其不同于GPU架构的创新得到了业内的关注 。而这正是我们要着重介绍的部分 。更适合AI计算的IPU芯片
近两年 , AI 芯片出现了各种品类的井喷 , 其中甚至出现一些堪称疯狂的另类产品 。
比如一家同样创立四年的AI芯片创业公司Cerebras Systems就发布了史上最大的半导体芯片Wafer Scale Engine(WSE) , 号称“晶圆级发动机” , 拥有1.2万亿个晶体管 , 比英伟达最大的GPU要大出56.7倍 。这块芯片主要瞄准的是超级计算和和大型云计算中心市场 , 其创新之处在于一体化的芯片设计大幅提高了内部的数据通信数据 , 但其架构仍然类似于GPU的计算架构 。
而Graphcore的 IPU与GPU的架构差异非常大 , 代表的是一种新的技术架构 , 可以说是专门为解决CPU和GPU在AI计算中难以解决的问题而设计的 。
文章图片
文章图片
IPU为AI计算提供了全新的技术架构 , 同时将训练和推理合二为一 , 兼具处理二者工作的能力 。
我们以目前已经量产的IPU的GC2处理器来看 , IPU GC2采用台积电的16nm工艺 , 拥有 236亿个晶体管 , 在120瓦的功耗下有125TFlops的混合精度 , 另外有45TB/s内存的带宽、8TB/s片上多对多交换总线 , 2.5 TB/s的片间IPU-Links 。
其中 , 片内有1216个IPU-Tiles独立处理器核心 , 每个Tile中有独立的IPU核 , 作为计算以及In-Processor-Memory(处理器内的内存) 。对整个GC2来说共有7296个线程(每个核心最多可以跑6个线程) , 能够支持7296个程序并行运行 , 处理器内的内存总共可以达到300MB , 其设计思路就是要把所有模型放在片内处理 。
首先 , IPU作为一个标准的神经网络处理芯片 , 可以支持多种神经网络模型 , 因其具备数以千计到数百万计的顶点数量 , 远远超过GPU的顶点规模 , 可以进行更高潜力的并行计算工作 。此外 , IPU的顶点的稀疏特性 , 令其也可以高效处理GPU不擅长的稀疏的卷积计算 。其次 , IPU 也支持了模型参数的复用 , 这些复用特性可以获取数据中的空间或时间不变性 , 对于训练与推理的性能会有明显帮助 。
其次 , 为解决芯片内存的宽带限制 , IPU采用了大规模并行MIMD(多指令流多数据流)众核架构 , 同时 , IPU架构做了大规模分布式的片上SRAM 。片内300MB的SRAM , 相对于GPU的GDDR、HBM来说 , 可以做到数十倍的性能提升 , 而且与访问外存相比 , SRAM的片内时延基本可以忽略不计 。
第三 , IPU采用了高效的多核通信技术BSP(Bulk Synchronous Parallel) 。IPU是目前世界上第一款采用BSP通信的处理器 , 支持内部1216个核心之间的通信以及跨不同的IPU之间的通信 。通过硬件支持BSP协议 , 并通过BSP协议把整个计算逻辑分成了计算、同步、交换 , 能极大方便工程师们的开发工作 。
文章图片
文章图片
【谷歌|为AI而生的IPU芯片,或挑战GPU的霸主位?】基于以上IPU的差异化特点 , IPU在某些批量训练和推理中能够获得更好的性能、更低延时和更快网络收敛 。片内的SRAM相对于片外存储 , 也有高带宽和低延时的优势 。
今年7月 , Graphcore发布了二代的Colossus MK2 IPU (MK2) , 以及包含四颗MK2芯片系统方案的IPU-Machine:M2000 (IPU-M2000) , 其核心数增加了20%, 达到1472个 , 8832个可并行执行的线程 。片内SRAM则多出3倍 , 增加到900MB , 互联扩展性能是上一代的16倍 。显然在计算、数据和通信扩展层面 , MK2都算是延续了第一代IPU堆料狂魔的作风 。
推荐阅读
- 科学|陈根:交织着“记”与“忘”的记忆,是如何发生的?
- 恒星|哈勃望远镜拍摄NGC 1365星系恒星诞生的壮丽景象
- YouTube|谷歌极力推动YouTube用户变现:在视频中加入商品链接 从交易中抽成30%
- |谷歌、苹果教你如何优雅地干掉竞争对手
- 谷歌|摄像头模块化!vivo分离式镜头斩获红点设计概念大奖
- 青年|余生的路, 我愿意与你一起走下去
- 谷歌,Android系统|谷歌助手现在可以为Android应用的操作创建自定义的快捷方式
- 谷歌|谷歌助手现在可以为Android应用的操作创建自定义的快捷方式
- 情感|古天乐接济78岁老戏骨,善良,将成为你人生的助力
- 谷歌|vivo WATCH评测:颜值拉满,玩法也足够多样