超级计算机|主流显卡新架构,涵盖架构内容,优势以及具体应用
Intel全新架构显卡定名:Iris Xe
Intel正在研发基于全新Xe架构的GPU , 包括低功耗的Xe LP、高性能的Xe HP、超高性能的Xe HPC三大部分 , 并突出Xe架构 , 当然这很可能是一个系列名称 , 不同级别的产品应该还会有不同的具体型号Iris Xe集成了96个计算单元 , 每单元8个核心(着色单元) , 共计768个核心 , 频率1.3GHz , 同时集成1MB二级缓存 。
本文插图
英特尔Iris Xe图形在Tiger Lake芯片上的性能比目前Ice Lake芯片上的Gen 11 GPU提高了2倍 , 比Skylake CPU和它的几个变种(Kaby Lake, Coffee Lake, Comet Lake)上的Gen 9.5 GPU提高了4倍 。 我们已经看到了一个令人印象深刻的演示 , 早期的Tiger Lake样品在便携式笔记本电脑上运行《战地5》 , 在高设置下 , 在1080p分辨率下平均提供30 FPS帧速率 。
本文插图
【超级计算机|主流显卡新架构,涵盖架构内容,优势以及具体应用】
要通吃几乎所有领域 , 从轻薄笔记本到桌面游戏 , 从高性能计算到超级计算机 。 Intel将继续保留Iris锐炬核显品牌 , 并突出Xe架构 , 当然这很可能是一个系列名称 , 不同级别的产品应该还会有不同的具体型号 , 即将发布的Tiger Lake , 也就是面向轻薄本的低功耗版第11代酷睿 , 将会首发Xe GPU , 今年年初Intel就曾做了公开展示 , 与之搭档的还将有10nm+增强版工艺、Willow Cove CPU架构 , 将会隶属于G7序列 。 这也是Xe LP低功耗版本的最高配置了 , 往下还会有减配的G4、G1序列 。
本文插图
AMD现有最新显卡架构:RDNA 2架构
据悉采用下代RDNA2构架的Radeon RX GPU能效比将比前代RDNA GPU提升50% , 支持光线追踪技术 。 AMD RDNA 2系列架构将有高中低端三个不同核心 , 分别命名为Navi 21、Navi 22、Navi 23 , 核心面积分别为505、304、240平方毫米左右 , 误差±5平方毫米 。 需要注意的是:RDNA 2架构的GPU并不是所有的都支持光追 , 只有高端和旗舰型号才支持光追 , 因为AMD将会在其內建立专门的硬件单元 。
本文插图
AMD GPU型号为Navi 21、Navi 10 Refresh(RDNA 1重制版)、Navi 22和Navi 23 GPU , 其中Navi 21是AMD计划在不久后将要发布的尺寸较大的RDNA 2芯片 , 目前已经知道的信息是Navi 21最多可达80个计算单元/ 5120 GPU内核、芯片尺寸约为505mmRDNA 相比 GCN 每瓦性能提升了 50% 。 AMD 还表示 , 新款 GPU 通过设计上的优化 , GPU 频率也增加了 。 中低端产品则侧重于高能效 , 也就是在尽可能低的功耗下获得尽可能高的性能 。 中低端卡不支持光追 , 即使上了光追能运行 , 用户体验不佳 , 与其将这部分性能浪费在跑光追上 , 不如将功耗降低 , 打造高能效比 , 让玩家玩得更舒服 , 同时价格很香 。
本文插图
即将发布的Radeon RX显卡将在RDNA 2和RDNA 1两种不同的GPU架构之间分配 。 4款型号的Navi 21 GPU , 这些显卡将面向AMD发烧用户 , 该信息来自泄漏的GPU的PCI ID , 以下是Rogame爆料的四个型号分别为:Navi 21 XTX(0x731F:D0)、Navi 21 XT(0x731F:D1)、Navi 21 XL(0x731F:D3)和Navi 21 XLE(0x731F:DF) , 这些型号的显卡将会取代现有的Radeon RX 5000系列显卡 。 除了游戏显卡之外Navi 21 GPU还将有两款Radeon Pro型号显卡 , 另外AMD甚至基于Navi 21还推出了四款针对Apple系列电脑的显卡 。
本文插图
英伟达最新架构 :安培“Ampere”架构
黄老板展示的安培(Ampere)架构 GPU 系统以最新英伟达 Tesla A100 芯片组成 , 被认为是迄今为止 GPU 算力最大的一步提升 , 据黄老板讲 , A100 是迄今为止人类制造出的最大 7 纳米制程芯片 。 A100 采用目前最先进的台积电(TSMC)7 纳米工艺 , 拥有 540 亿个晶体管 , 它是一块 3D 堆叠芯片 , 面积高达 826mm^2 , GPU 的最大功率达到了 400W 。
本文插图
这块 GPU 上搭载了容量 40G 的三星 HBM2 显存(比 DDR5 速度还快得多 , 就是很贵) , 第三代 Tensor Core 。 同时它的并联效率也有了巨大提升 , 其采用带宽 600GB/s 的新版 NVLink , 几乎达到了 10 倍 PCIE 互联速度 。 随着安培架构出现的三代 Tensor Core 对稀疏张量运算进行了特别加速:执行速度提高了一倍 , 也支持 TF32、FP16、BFLOAT16、INT8 和 INT4 等精度的加速系统会自动将数据转为 TF32 格式加速运算 , 现在你无需修改任何代码量化了 , 直接自动训练即可 。 GPC单元屏蔽了整整一组 , 但剩余的也并未全部开启 , 其中两组GPC也各自屏蔽了一个TPC(两组SM) , 导致总的SM单元为108个、流处理器为6912个、Tensor核心为432个 。 核心加速频率1410MHz , 比前两代其实都低了 , 但整体性能在飞跃 。 显存也没有逃过刀法 , 只开启了五组HBM2 , 所以总容量为40GB , 总位宽为5120-bit , 频率1215MHz , 带宽1555GB/s , 比上代增加73% 。
本文插图
基于A100的系统可以扩展到数十、数百或数千个A100 , 用于计算集群、云实例或超大型超级计算机 , 从而满足多种类型的应用程序和工作负载的加速需求 。 尤其是GA100架构中的计算单元结构优化 , 包括支持新精度和结构化稀疏 , 本质上是在围绕AI和HPC的特性在做文章 。 正如NVIDIA近年来所强调的 , 它已从一家纯粹的显卡公司进化为一系列AI与HPC计算解决方案的提供商 。 无论是计算与内存结构的升级 , 还是互联技术的迭代进化 , 都与NVIDIA积累的强大研究和工程能力密不可分 。 这些技术进步所带来的更强算力 , 将催化AI、5G、数据科学、机器人、基因组学、金融分析等诸多领域的创新研究与应用进程 。 当许多公司还以超越NVIDIA V100算力为目标时 , NVIDIA已经冲向计算的下一个纪元 。
本文插图
A100
推荐阅读
- 主流纯电三厢家轿 外观设计感强 智能配置豪华 空间大充电快
- 别再学习框架了,看看这些让你起飞的计算机基础知识
- 王一博追星成功,收到瓦伦蒂诺·罗西签名照,超级迷弟圆梦
- 漫威|10个漫威反派合体变啥样?网友:超级灭霸!
- 量子物理学|量子物理学的重要应用,与普通计算机结构完全不同,还需继续探索
- 超级计算机|他们搬动了百万行代码“大山”
- 20万元主流新选择,这三款合资SUV不容错过!
- iQOO 5系列正式发布:120Hz屏幕+120W超级快充,宝马定制版亮眼 | 小米10至尊版稳了?
- 电音|超级秀晚会现场:群星演唱自带电音,打光诡异毛晓彤秒变180斤
- |苏宁易购818战报:超1.4亿人次围观7小时超级秀
