超级计算机|主流显卡新架构，涵盖架构内容，优势以及具体应用 |AMD|英特尔|

Intel全新架构显卡定名：Iris Xe
Intel正在研发基于全新Xe架构的GPU ，包括低功耗的Xe LP、高性能的Xe HP、超高性能的Xe HPC三大部分，并突出Xe架构，当然这很可能是一个系列名称，不同级别的产品应该还会有不同的具体型号Iris Xe集成了96个计算单元，每单元8个核心(着色单元) ，共计768个核心，频率1.3GHz ，同时集成1MB二级缓存。

本文插图

英特尔Iris Xe图形在Tiger Lake芯片上的性能比目前Ice Lake芯片上的Gen 11 GPU提高了2倍，比Skylake CPU和它的几个变种（Kaby Lake, Coffee Lake, Comet Lake）上的Gen 9.5 GPU提高了4倍。我们已经看到了一个令人印象深刻的演示，早期的Tiger Lake样品在便携式笔记本电脑上运行《战地5》，在高设置下，在1080p分辨率下平均提供30 FPS帧速率。

本文插图
【超级计算机|主流显卡新架构，涵盖架构内容，优势以及具体应用】

要通吃几乎所有领域，从轻薄笔记本到桌面游戏，从高性能计算到超级计算机。 Intel将继续保留Iris锐炬核显品牌，并突出Xe架构，当然这很可能是一个系列名称，不同级别的产品应该还会有不同的具体型号，即将发布的Tiger Lake ，也就是面向轻薄本的低功耗版第11代酷睿，将会首发Xe GPU ，今年年初Intel就曾做了公开展示，与之搭档的还将有10nm+增强版工艺、Willow Cove CPU架构，将会隶属于G7序列。这也是Xe LP低功耗版本的最高配置了，往下还会有减配的G4、G1序列。

本文插图

AMD现有最新显卡架构：RDNA 2架构
据悉采用下代RDNA2构架的Radeon RX GPU能效比将比前代RDNA GPU提升50% ，支持光线追踪技术。 AMD RDNA 2系列架构将有高中低端三个不同核心，分别命名为Navi 21、Navi 22、Navi 23 ，核心面积分别为505、304、240平方毫米左右，误差±5平方毫米。需要注意的是：RDNA 2架构的GPU并不是所有的都支持光追，只有高端和旗舰型号才支持光追，因为AMD将会在其內建立专门的硬件单元。

本文插图

AMD GPU型号为Navi 21、Navi 10 Refresh(RDNA 1重制版)、Navi 22和Navi 23 GPU ，其中Navi 21是AMD计划在不久后将要发布的尺寸较大的RDNA 2芯片，目前已经知道的信息是Navi 21最多可达80个计算单元/ 5120 GPU内核、芯片尺寸约为505mmRDNA 相比 GCN 每瓦性能提升了 50% 。 AMD 还表示，新款 GPU 通过设计上的优化， GPU 频率也增加了。中低端产品则侧重于高能效，也就是在尽可能低的功耗下获得尽可能高的性能。中低端卡不支持光追，即使上了光追能运行，用户体验不佳，与其将这部分性能浪费在跑光追上，不如将功耗降低，打造高能效比，让玩家玩得更舒服，同时价格很香。

本文插图

即将发布的Radeon RX显卡将在RDNA 2和RDNA 1两种不同的GPU架构之间分配。 4款型号的Navi 21 GPU ，这些显卡将面向AMD发烧用户，该信息来自泄漏的GPU的PCI ID ，以下是Rogame爆料的四个型号分别为：Navi 21 XTX(0x731F：D0)、Navi 21 XT(0x731F：D1)、Navi 21 XL(0x731F：D3)和Navi 21 XLE(0x731F：DF) ，这些型号的显卡将会取代现有的Radeon RX 5000系列显卡。除了游戏显卡之外Navi 21 GPU还将有两款Radeon Pro型号显卡，另外AMD甚至基于Navi 21还推出了四款针对Apple系列电脑的显卡。

本文插图

英伟达最新架构：安培“Ampere”架构
黄老板展示的安培（Ampere）架构 GPU 系统以最新英伟达 Tesla A100 芯片组成，被认为是迄今为止 GPU 算力最大的一步提升，据黄老板讲， A100 是迄今为止人类制造出的最大 7 纳米制程芯片。 A100 采用目前最先进的台积电（TSMC）7 纳米工艺，拥有 540 亿个晶体管，它是一块 3D 堆叠芯片，面积高达 826mm^2 ， GPU 的最大功率达到了 400W 。

本文插图

这块 GPU 上搭载了容量 40G 的三星 HBM2 显存（比 DDR5 速度还快得多，就是很贵），第三代 Tensor Core 。同时它的并联效率也有了巨大提升，其采用带宽 600GB/s 的新版 NVLink ，几乎达到了 10 倍 PCIE 互联速度。随着安培架构出现的三代 Tensor Core 对稀疏张量运算进行了特别加速：执行速度提高了一倍，也支持 TF32、FP16、BFLOAT16、INT8 和 INT4 等精度的加速系统会自动将数据转为 TF32 格式加速运算，现在你无需修改任何代码量化了，直接自动训练即可。 GPC单元屏蔽了整整一组，但剩余的也并未全部开启，其中两组GPC也各自屏蔽了一个TPC(两组SM) ，导致总的SM单元为108个、流处理器为6912个、Tensor核心为432个。核心加速频率1410MHz ，比前两代其实都低了，但整体性能在飞跃。显存也没有逃过刀法，只开启了五组HBM2 ，所以总容量为40GB ，总位宽为5120-bit ，频率1215MHz ，带宽1555GB/s ，比上代增加73% 。

本文插图

基于A100的系统可以扩展到数十、数百或数千个A100 ，用于计算集群、云实例或超大型超级计算机，从而满足多种类型的应用程序和工作负载的加速需求。尤其是GA100架构中的计算单元结构优化，包括支持新精度和结构化稀疏，本质上是在围绕AI和HPC的特性在做文章。正如NVIDIA近年来所强调的，它已从一家纯粹的显卡公司进化为一系列AI与HPC计算解决方案的提供商。无论是计算与内存结构的升级，还是互联技术的迭代进化，都与NVIDIA积累的强大研究和工程能力密不可分。这些技术进步所带来的更强算力，将催化AI、5G、数据科学、机器人、基因组学、金融分析等诸多领域的创新研究与应用进程。当许多公司还以超越NVIDIA V100算力为目标时， NVIDIA已经冲向计算的下一个纪元。

本文插图

A100

超级计算机|主流显卡新架构，涵盖架构内容，优势以及具体应用

推荐阅读

别在忧伤时回答|是一个人最大的修行，【荐读】好好吃饭

股票|从亏损中悟出的炒股模式：炒股只看4个字就足够，少奋斗10年

汽车之家|不光有颜值还有内在！，丰田威兰达高级脸的车来了

光芯片制造最难的是光刻机吗,为什么制造芯片光刻机就这么难

车家号|都有哪些值得一看？，今年上市的新车中

Selina产子细节曝光！SHE姐妹现身医院陪同，家人最后才得知消息

华为Mate|外媒曝华为Mate 40将配备双扬声器：或与华为 Mate20X同款

散热不好的笔记本用什么散热器笔记本用散热器好吗吗

怎样开口跟刚认识的朋友要设计费

分享7款人气焗油膏品牌焗油膏什么牌子好

孔子为什么去见南子?孔子里的南子喜欢孔子吗

#舌尖学问#清脆虾仁，美味蛋包饭的做法这几道家常菜的做法，可乐鸡翅

音乐大烩菜|该不会是整形公司开发的吧？，我靠！这款APP

智选之家|即将短兵相接！，10月手机大战：华为小米苹果一加

简单家常菜：酱爆豆腐，豆干炒肉，豆豉虎皮青椒

纵相新闻|带示威者闹到市长家门口，西雅图女议员被指“泄露机密”

肖战|《跨界歌王》邀请肖战、王一博？有人开始狙击，改过自新不好吗

科技有话说希捷展示全球首款双磁臂技术机械硬盘

蒙蒙烟雨|我不能打你闺蜜的歪主意吗？，爆笑段子：你以前不是说过

小霸王谈车▲打电话全部拒接，次日开车时傻眼了，奔驰乱停车堵住停车场