NVIDIA 在 MLPerf Training v5.1 中凭借 Blackwell Ultra GPU 取得主导地位

realtime news   Nov 13, 2025 10:56  UTC 02:56

1 Min Read

NVIDIA 再次展示了其在 AI 训练性能方面的主导地位,在最新的 MLPerf Training v5.1 基准测试中横扫所有七项测试。根据 NVIDIA 的博客,该公司在各类 AI 模型类别中展示了最快的训练时间,包括大语言模型 (LLMs)、图像生成、推荐系统、计算机视觉和图神经网络。

Blackwell Ultra 的精彩首秀

本轮的亮点是 GB300 NVL72 机架级系统的首次亮相,该系统由 NVIDIA 的 Blackwell Ultra GPU 架构提供动力。这个系统提供了突破性的性能,相比其前身 Hopper 架构,Llama 3.1 405B 模型的预训练速度提升了四倍以上,Llama 2 70B 模型的微调速度提升了近五倍。

这些性能提升归功于 Blackwell Ultra 的先进架构特性,包括能够执行 15 petaflops NVFP4 AI 计算的新 Tensor Cores 和 279GB 的 HBM3e 内存。该公司还引入了新的训练方法,以有效利用架构的 NVFP4 计算能力。

AI 训练精度的进步

NVIDIA 在这一基准测试中的成功可归因于其在 AI 训练中开创性地使用 NVFP4 精度——这是 MLPerf 历史上的首次。此方法允许架构在位数更少的数据上进行计算,在显著提高计算速度的同时保持精度。这一创新是 NVIDIA 更广泛战略的一部分,旨在优化 AI 模型以缩短训练时间。

创纪录的性能指标

NVIDIA 的 Blackwell GPUs 创造了新纪录,仅用 10 分钟便训练了 Llama 3.1 405B 模型,这要归功于超过 5,000 个 GPU 的高效扩展。这一壮举比以往的结果提升了 2.7 倍。此外,NVIDIA 在 Llama 3.1 8B 和 FLUX.1 模型上创下了新基准,强调了其在 AI 训练中持续创新的承诺。

行业合作与未来展望

NVIDIA 的合作伙伴生态系统,包括戴尔科技和惠普企业等知名科技公司,在取得这些成果中发挥了至关重要的作用。这种广泛的合作突显了 NVIDIA 技术的强大支持和可扩展性,推动了 AI 能力的快速进步。

随着 NVIDIA 继续快速创新,为 AI 采用和智能化的空前增长奠定了基础,铺平了 AI 训练和推理未来突破的道路。



Read More