快科技7nm安培GPU详解：400W功耗、40GB HBM2、826mm2怪兽出炉

等了很久，今晚NVIDIA正式发布了7nm安培GPU ，号称是8代GPU史上最大的性能飞跃。不过官方并没有公布安培GPU的技术细节， Anandtech网站倒是给出了一份详细的介绍。
【快科技7nm安培GPU详解：400W功耗、40GB HBM2、826mm2怪兽出炉】这次的GTC 2020大会演讲中， NVIDIA CEO黄仁勋主要谈的就是HPC计算、AI人工智能等方面的内容，目前推出的A100大核心也是针对这个领域的，与之相比的是3年前发布的Volta架构V100核心，很多东西跟RTX 3080 Ti游戏卡会不一样，大家不用纠结。

本文插图

首先来说大方面的， V100核心使用的是12nm Volta架构， 211亿晶体管，核心面积815mm2 ，而A100核心是台积电7N工艺，应该也是定制版的7nm工艺， 826mm2 ， 542亿晶体管，同样是核弹级别的。
V100核心拥有80组SM单元， 5120个CUDA核心， SXM2/3架构，而A100核心是108组SM单元， SXM4架构， 6912个CUDA核心。
AI方面是变化最大的，相比Volta架构的640个Tensor Core ， A100核心的Tensor Core减少到了432个，但是
性能大幅增强，支持全新的TF32运算，浮点性能156TFLOPS ，同时INT8浮点性能624TOPS ， FP16性能312TFLOPS 。
常规的FP32、FP64性能提升倒是不算明显，
从V100核心的15.7.、7.8TFLOPS提升到了19.5、9.7TFLOPS 。
频率方面， A100核心实际上还倒退了，从V100的1530MHz降低到了1.41GHz左右，毕竟核心规模实在太大，功耗已经飙到了400W ，比V100的300/350W功耗高出不少。
显存方面， A100配备的也是HBM2显存，频率从1.75Gbps提升到了2.4Gbps ，位宽5120bit ，相比V100的4096bit增加了1024bit ，容量也从16/32GB增加到了40GB 。
不过HBM2的配置略显奇怪，增加1024bit理论上应该多1组HBM2 ，但从核心图上看又是6组HBM2显存，或许是2组512bit的？保不准以后还会有完整版A100核心。
不过HBM2显存位宽、频率双双提升的后果就是， A100核心寸带宽达到了1.6TB/s ，远高于V100的900GB/s ，比AMD的Radeon VII显卡的1TB/s带宽还要高。
最后， NVLink技术也升级到了3.0版，带宽从300GB/s提升到了600GB/s ，适合服务器领域多卡互联，不过未来应该还会有PCIe版的。

本文插图

本文插图

快科技7nm安培GPU详解：400W功耗、40GB HBM2、826mm2怪兽出炉

推荐阅读

你认为啥是人性化设计

农村俗语“古有四不借，借了家败亡”，你知道是哪4样东西吗

[钟欣潼]钟欣潼离婚后剪短发现身，橙色棒球帽配利落短发，酷帅十足像男孩

一夜征人尽思乡|最新航母破坏者飞向南海，美：为何不早公开，反航母不只有东风21D

商鞅孙膑谁厉害?孙膑和商鞅是一个时代的吗-

「中金网」全球股市在前日油价大涨后企稳

仟与仟寻|林丹退役不是完结，终能集中发力商业版图，先来个乘风破浪的姐夫

竖锯评测|Plus家用5G智能投影仪评测，将电影院“搬进”家里？微果H6

在上海买房，自己出钱首付，婚前买还是婚后买好

科勒·卡戴珊|卡戴珊曝光与汤普森二胎儿子照片！两人因TT出轨分手，并有私生子

凯特王妃：凯特居然把平平无奇的波点裙穿“活”了！金发细腰身材不输超模

特朗普|美国记者质问特朗普为何对人民撒谎，被怼：你的措辞是种耻辱

小葵花唯一勇士已经准备了数年，为了争取得到阿德托昆博

直播不止能带货，品牌营销才是重点

上观新闻▲都和浦东这家达能纽迪希亚有关，这些全球知名的母婴品牌

怎么把自己皮肤养得好好的？

直播|CNN女记者直播节目中被抢劫，网友：可能他太帅想上镜

中华周易研究院|物质现实，只顾眼前利益，败尽丈夫家业！，四种“败夫相”

啥是活在当下咋理解活的太有目的性容易迷茫

表姐的电影|前三位个个美若天仙，唯独她像村姑，4个版本“王语嫣”