NVIDIA 在 MLPerf Training v5.1 中凭借 Blackwell Ultra GPU 取得主导地位

NVIDIA 在 MLPerf Training v5.1 中凭借 Blackwell Ultra GPU 取得主导地位 - Blockchain.News

NVIDIA 再次展示了其在 AI 训练性能方面的主导地位，在最新的 MLPerf Training v5.1 基准测试中横扫所有七项测试。根据 NVIDIA 的博客，该公司在各类 AI 模型类别中展示了最快的训练时间，包括大语言模型 (LLMs)、图像生成、推荐系统、计算机视觉和图神经网络。

Blackwell Ultra 的精彩首秀

本轮的亮点是 GB300 NVL72 机架级系统的首次亮相，该系统由 NVIDIA 的 Blackwell Ultra GPU 架构提供动力。这个系统提供了突破性的性能，相比其前身 Hopper 架构，Llama 3.1 405B 模型的预训练速度提升了四倍以上，Llama 2 70B 模型的微调速度提升了近五倍。

这些性能提升归功于 Blackwell Ultra 的先进架构特性，包括能够执行 15 petaflops NVFP4 AI 计算的新 Tensor Cores 和 279GB 的 HBM3e 内存。该公司还引入了新的训练方法，以有效利用架构的 NVFP4 计算能力。

AI 训练精度的进步

NVIDIA 在这一基准测试中的成功可归因于其在 AI 训练中开创性地使用 NVFP4 精度——这是 MLPerf 历史上的首次。此方法允许架构在位数更少的数据上进行计算，在显著提高计算速度的同时保持精度。这一创新是 NVIDIA 更广泛战略的一部分，旨在优化 AI 模型以缩短训练时间。

创纪录的性能指标

NVIDIA 的 Blackwell GPUs 创造了新纪录，仅用 10 分钟便训练了 Llama 3.1 405B 模型，这要归功于超过 5,000 个 GPU 的高效扩展。这一壮举比以往的结果提升了 2.7 倍。此外，NVIDIA 在 Llama 3.1 8B 和 FLUX.1 模型上创下了新基准，强调了其在 AI 训练中持续创新的承诺。

行业合作与未来展望

NVIDIA 的合作伙伴生态系统，包括戴尔科技和惠普企业等知名科技公司，在取得这些成果中发挥了至关重要的作用。这种广泛的合作突显了 NVIDIA 技术的强大支持和可扩展性，推动了 AI 能力的快速进步。

随着 NVIDIA 继续快速创新，为 AI 采用和智能化的空前增长奠定了基础，铺平了 AI 训练和推理未来突破的道路。

Image source: Shutterstock

NVIDIA 在 MLPerf Training v5.1 中凭借 Blackwell Ultra GPU 取得主导地位

Blackwell Ultra 的精彩首秀

AI 训练精度的进步

创纪录的性能指标

行业合作与未来展望

Premium Sponsors

Flash News