NVLINK 结构

推动多 GPU 处理技术发展

更大限度提高系统吞吐量

更大限度提高系统吞吐量

NVIDIA® NVLink 技术提供更高带宽与更多链路,并可提升多 GPU 和多 GPU/CPU 系统配置的可扩展性,因而可以解决这种互联问题。单个 NVIDIA Tesla® V100 GPU 即可支持多达六条 NVLink 链路,总带宽为 300 GB/秒,这是 PCIe 3 带宽的 10 倍。全新 NVIDIA DGX-1 等服务器充分利用这些技术来提高可扩展性,进而实现超快速的深度学习训练。

GPU 至 GPU 通信加速的新水平

Tesla V100 中采用的 NVLink 首先引入 NVIDIA Pascal 架构,将每个方向的信号发送速率从 20 GB/每秒增加到 25 GB/每秒。此产品可用于 GPU 至 CPU 或 GPU 至 GPU 的通信,配备 Tesla V100 的 DGX-1 即是如此.

Tesla V100 中以 NVLink 连接的 GPU 至 GPU 和 GPU 至 CPU 通信
在 DGX-1V 服务器中,混合立体网络拓扑使用 NVLink 连接 8 个 Tesla V100 加速器
新的性能水平

新的性能水平

NVIDIA NVLink 将采用相同配置的服务器性能提高 31%。此产品可极大提高带宽并减少延迟,即使更大型的深度学习工作负载不断增加,也能实现性能扩展.

NVSWITCH:完全连接的 NVLINK

由于 PCIe 带宽日益成为多 GPU 系统级别的瓶颈,深度学习工作负载的快速增长使得对更快速、更可扩展的互连的需求逐渐增加。

NVLink 实现了很大的进步,可以在单个服务器中支持八个 GPU,并且可提升性能,使之超越 PCIe。但是,要将深度学习性能提升到一个更高水平,将需要使用 GPU 架构,该架构在一台服务器上支持更多的 GPU 以及 GPU 之间的全带宽连接。

NVIDIA NVSwitch 是首款节点交换架构,可支持单个服务器节点中 16 个全互联的 GPU,并可使全部 8 个 GPU 对分别以 300 GB/s 的惊人速度进行同时通信。这 16 个全互联的 GPU 还可作为单个大型加速器,拥有 0.5 TB 统一显存空间和 2 PetaFLOPS 计算性能。

NVSwitch Chart Speedup