AI推理性能最高提升20倍,IBM首款7nm商用处理器POWER10面世
机器之心报道
编辑:蛋酱、小舟、杜伟
历时 5 年 , 制程由 14nm 减至 7nm , 更加重视 AI 推理性能 , IBM 最新 POWER10 处理器将在商用领域打出一片天地 。
本文插图
在今年的 Hot Chips 2020 会议上 , IBM 正式宣布了新一代 CPU POWER10 。 作为 Power 9 的继任者 , POWER10 的处理效率是前者的三倍 , 同时又提供了更高的工作负载量和容器密度 。
基于 Power 9 处理器并使用 Nvidia Tesla GPU 作为加速器的 Summit , 就是世界上最快的超级计算机之一 。 目前看来 , 继任者 POWER10 更加值得期待 。
POWER10 的设计历时五年 , 拥有数百项新型以及正在申请的专利 。 早在 2015 年 , IBM、三星和 IBM 研究联盟的其他成员生产了第一批测试芯片 。 它的独特之处在于 , 这是 IBM 的首款商用 7 nm 处理器 。
POWER10 架构师 William Starke 表示 , 单芯片模块产品最多不超过 15 个 SMT8 核心 , 双芯片模块产品最多不超过 30 个 SMT8 核心 。
本文插图
IBM POWER 系列芯片的发展路线图 。
制程由 14nm 缩减至 7nm , 更加重视 AI 推理性能
吞吐量和功率效率的提升部分得益于硅制程技术 , 该技术使得 POWER9 中使用的 14nm GlobalFoundries 制程缩减为三星的 7nm EUV 。 制程微缩使得 IBM 可以添加更多的核心和更多的缓存 。
设计方法也有重大更改 。 新的设计更加模块化 , 具有新的核心核心微架构和新的 AI 指令 。 POWER10 还添加了更多的安全硬件 。 内存受到全内存加密保护 , 同时也没有降低速度 。
此外 , POWER10 还为多租户(multi-tenant)云工作负载内置了「嘈杂的邻居(noisy neighbor)」保护功能 。 为了确保云工作负载的安全性 , 处理器支持安全的 container 。 该架构通过其 PowerVM 虚拟机来管理程序和内存池聚合功能 , 以提升灵活性 , 通过 PB 级系统内存支持来处理各种工作负载 。
考虑到 AI 越来越重要 , IBM 增加了对其他指令和数据类型的支持 。 处理器通过新的可扩展指令集支持 Power 的 3.1 版本 。 POWER10 也意味着 IBM 更加重视 CPU 中的 AI 推理性能 。
IBM 表示 , 推理处理中使用的矩阵数学函数可将性能提升 10-20 倍 。 缓存带宽上也有改进 , 以使 SIMD 单元获得数据 。
越来越多的企业将 AI 部署到实际应用 AI 的运营工作负载中 。 所以 , IBM 仍将支持训练加速器 , 例如 GPU 和 FPGA , 但 AI 部署基于的推理使用的是训练创建的模型 。
实际上 , AI 的推理用途是能够产生商业实效的 。 IBM 将在 PCIe5.0 版本上通过 OpenCAPI 支持加速器 。 IBM 也放弃了英伟达的 NVLink 接口 , 因为 PCIe v5 提供了足够的带宽 。
本文插图
POWER10 的推理性能展示 。
其他技术细节
IBM 在 Hot Chips 会议上展示了 POWER10 的大量技术细节 。 芯片面积为 600 平方毫米 , 具有 180 亿个晶体管 。 最多两个管芯可以被放入 POWER10 服务器的包中 。
每个芯片具有 15 个活跃的 CPU 核 , 其中管芯上还有一个用于提升成品率的备用核 。 此外 , 每个 CPU 可以支持 8 个线程(虚拟 CPU) , 所以每个插槽中共计有 120 个线程 。
管芯上缓存内存总量为 150MB 以上 。 在接口设置上 , 下一代 PCI Express Gen 5 具有 64 条通路 , 传输速度高达 32GT/s 。
推荐阅读
- 【】违规出租厨房、阳台、地下储藏室,最高罚50万
- 中新经纬|住建部拟规定:住房租赁企业违规开展租金贷最高罚10万
- 孤惯|性价比最高的电脑音箱有哪些?20款50-500元电脑音箱推荐
- 北京日报客户端|违规出租厨房、阳台、地下储藏室,最高罚50万
- 住建部拟对住房租赁规定:出租地下室等非居住空间最高罚款50万
- 跑分|华为加速退场,40万跑分+8+128GB暴跌800,成华为“千元性能机皇”
- 股票|国元证券连续第13年被深交所评为信息披露最高等级
- 慧眼识龙头T|当前市场最高!“三进四的长方集团,资金都是在创业板里博弈”
- 楚天都市报、人民网|地铁里手机外放、吃东西旁若无人?最高罚500元!
- 第一财经|豫园股份要约收购金徽酒8%股份,最高耗资7.15亿元