|拥抱Arm,将Quadro性能翻倍,英伟达刚刚发布DPU战略( 二 )
本文插图
构建机器人相关的软件和 AI 的开发流程有些类似 , 人们会使用 DGX 这样的设备编写和训练 , 并在 Jetson 这样的端侧运行 。 在实践中 , 英伟达研究人员已经训练了很多现成模型 , 使用迁移学习工具 , 任何人都可以把它们应用在自己的任务上 。 在机器人领域 , 现在还可以通过实时的 AI 模拟环境大幅度提高训练的效率 。
本文插图
图片来自 anandtech 。
除了价格更低之外 , Jetson Nano 2GB 的计算配置和常规 Jetson Nano 相同 , 有 4 个 Cortex-A57 CPU 内核的 CPU , 以及 128 个 CUDA 核的 Maxwell 架构 GPU 。 不过 2GB 版本相比标准版少了 DisplayPort 输出 , USB 接口也不是 3.0 的 。
本文插图
还记得刚发布的奔驰 S 级吗?这台车是梅赛德斯有史以来最智能化的车型 , 其中搭载了三块带英伟达 GPU 的计算芯片 。 在 GTC Keynote 上 , 英伟达还宣布了和奔驰的新合作计划:到 2024 年 , 所有奔驰车系都将搭载英伟达的 DRIVE AV 芯片 。
本文插图
推出 DPU , 基于 Arm 架构的可编程数据中心芯片
我们都知道英伟达正在收购 Arm , 不过相比商业行为 , 英伟达的技术进展更快一些 。 这家公司在收购 Mellanox 之后 , 共同研发了新一代计算单元 DPU 。
英伟达推测 , 全球服务器的算力吞吐总量每两年增长十倍 , 而在 2020 年中 , 仅在 AI 推断任务中 , 在所有云服务器中使用 GPU 的算力数量已经超过了 CPU 。 「按照这个趋势 , 在几年之后英伟达的 GPU 将会承载超过 90% 的全球 AI 推理算力 。 任何 AI 的应用和服务现在都可以基于英伟达芯片 , 」黄仁勋说道 。
本文插图
AI 和数据分析应用必须是分布式的 , 由多个 GPU 和节点负责运算 , 云服务实际上也是巨量的「微服务」 , 这种新型的工作负载对虚拟化、网络、存储和安全提出了新的要求 。 在数据中心的计算设备上 , 人们提出了 DPU(Data Processing Unit)的新概念 。 这是一种更多通过软件定义的基础设施芯片 。
本文插图
新发布的 DPU 名为 Bluefield-2 , 这种计算卡是以可编程 Arm 架构 CPU 为核心运作的 。
本文插图
Bluefield-2 DPU 拥有 70 亿晶体管 , 将可编程的数据中心压缩成芯片大小 。 与之相对的 , 英伟达也发布了 DOCA——可编程数据中心基础设施处理器的软件架构 , 允许开发者在 DPU 上构建自己的应用 。 英伟达表示 , DOCA 可以无缝兼容所有主流系统 。
本文插图
Bluefield-2 只是一个开始 , 在英伟达的计划中 , Bluefield-4 将会引入 CUDA 和 NVIDIA AI , 大大加速网络中计算机视觉应用处理的速度 。
如果用户现在就对 AI 算力有很高需求 , 英伟达也发布了 Bluefield-2X , 其中的安培架构 GPU 核心可以用于处理所需任务 。 「Bluefield-2X 可以让你就像已经拥有了 Bluefield-4 一样 , 」黄仁勋说道 。 「在几年之后 , 我们将会带来近 1000 倍的吞吐量 , 并提供 200-400Gbps 的数据速度 。 」
推荐阅读
- ARM|芯片的战争:重构与平衡
- 飞宇|积极拥抱千元价位飞宇AK2000C单反微单云台稳定器 稳吗?
- 防火墙|ARM高管:被NVIDIA收购后将继续保留“防火墙”
- 大核|ARM未来两代CPU大核揭晓:性能较Cortex-A78提升30%
- |ARM CPU将在2022年放弃对32位运算的支持
- 王石头|小米6用户“开大招”,给手机刷上统信UOS系统,拥抱国产了!
- IT之家|小米 8 手机正研究刷入 Win10 ARM 系统
- 英伟达|英伟达CEO表示,ARM过于具体,需要成为一个广泛的计算平台
- |英伟达:将与 Arm 合作推出 PC 平台产品
- 暮年|华为或被禁止芯片设计?荷兰人:日本孙正义已将ARM卖给美国