|拥抱Arm,将Quadro性能翻倍,英伟达刚刚发布DPU战略( 二 )


|拥抱Arm,将Quadro性能翻倍,英伟达刚刚发布DPU战略
本文插图

构建机器人相关的软件和 AI 的开发流程有些类似 , 人们会使用 DGX 这样的设备编写和训练 , 并在 Jetson 这样的端侧运行 。 在实践中 , 英伟达研究人员已经训练了很多现成模型 , 使用迁移学习工具 , 任何人都可以把它们应用在自己的任务上 。 在机器人领域 , 现在还可以通过实时的 AI 模拟环境大幅度提高训练的效率 。
|拥抱Arm,将Quadro性能翻倍,英伟达刚刚发布DPU战略
本文插图

图片来自 anandtech 。
除了价格更低之外 , Jetson Nano 2GB 的计算配置和常规 Jetson Nano 相同 , 有 4 个 Cortex-A57 CPU 内核的 CPU , 以及 128 个 CUDA 核的 Maxwell 架构 GPU 。 不过 2GB 版本相比标准版少了 DisplayPort 输出 , USB 接口也不是 3.0 的 。
|拥抱Arm,将Quadro性能翻倍,英伟达刚刚发布DPU战略
本文插图

还记得刚发布的奔驰 S 级吗?这台车是梅赛德斯有史以来最智能化的车型 , 其中搭载了三块带英伟达 GPU 的计算芯片 。 在 GTC Keynote 上 , 英伟达还宣布了和奔驰的新合作计划:到 2024 年 , 所有奔驰车系都将搭载英伟达的 DRIVE AV 芯片 。
|拥抱Arm,将Quadro性能翻倍,英伟达刚刚发布DPU战略
本文插图

推出 DPU , 基于 Arm 架构的可编程数据中心芯片
我们都知道英伟达正在收购 Arm , 不过相比商业行为 , 英伟达的技术进展更快一些 。 这家公司在收购 Mellanox 之后 , 共同研发了新一代计算单元 DPU 。
英伟达推测 , 全球服务器的算力吞吐总量每两年增长十倍 , 而在 2020 年中 , 仅在 AI 推断任务中 , 在所有云服务器中使用 GPU 的算力数量已经超过了 CPU 。 「按照这个趋势 , 在几年之后英伟达的 GPU 将会承载超过 90% 的全球 AI 推理算力 。 任何 AI 的应用和服务现在都可以基于英伟达芯片 , 」黄仁勋说道 。
|拥抱Arm,将Quadro性能翻倍,英伟达刚刚发布DPU战略
本文插图

AI 和数据分析应用必须是分布式的 , 由多个 GPU 和节点负责运算 , 云服务实际上也是巨量的「微服务」 , 这种新型的工作负载对虚拟化、网络、存储和安全提出了新的要求 。 在数据中心的计算设备上 , 人们提出了 DPU(Data Processing Unit)的新概念 。 这是一种更多通过软件定义的基础设施芯片 。
|拥抱Arm,将Quadro性能翻倍,英伟达刚刚发布DPU战略
本文插图

新发布的 DPU 名为 Bluefield-2 , 这种计算卡是以可编程 Arm 架构 CPU 为核心运作的 。
|拥抱Arm,将Quadro性能翻倍,英伟达刚刚发布DPU战略
本文插图

Bluefield-2 DPU 拥有 70 亿晶体管 , 将可编程的数据中心压缩成芯片大小 。 与之相对的 , 英伟达也发布了 DOCA——可编程数据中心基础设施处理器的软件架构 , 允许开发者在 DPU 上构建自己的应用 。 英伟达表示 , DOCA 可以无缝兼容所有主流系统 。
|拥抱Arm,将Quadro性能翻倍,英伟达刚刚发布DPU战略
本文插图

Bluefield-2 只是一个开始 , 在英伟达的计划中 , Bluefield-4 将会引入 CUDA 和 NVIDIA AI , 大大加速网络中计算机视觉应用处理的速度 。
如果用户现在就对 AI 算力有很高需求 , 英伟达也发布了 Bluefield-2X , 其中的安培架构 GPU 核心可以用于处理所需任务 。 「Bluefield-2X 可以让你就像已经拥有了 Bluefield-4 一样 , 」黄仁勋说道 。 「在几年之后 , 我们将会带来近 1000 倍的吞吐量 , 并提供 200-400Gbps 的数据速度 。 」


推荐阅读