NVIDIA 在 MLPerf Training v5.1 中凭借 Blackwell Ultra GPU 取得主导地位
realtime news Nov 13, 2025 02:56
NVIDIA 在 MLPerf Training v5.1 基准测试中大获全胜,其 Blackwell Ultra GPU 架构在多个 AI 模型类别中展示了卓越的 AI 训练性能。
NVIDIA 再次展示了其在 AI 训练性能方面的主导地位,在最新的 MLPerf Training v5.1 基准测试中横扫所有七项测试。根据 NVIDIA 的博客,该公司在各类 AI 模型类别中展示了最快的训练时间,包括大语言模型 (LLMs)、图像生成、推荐系统、计算机视觉和图神经网络。
Blackwell Ultra 的精彩首秀
本轮的亮点是 GB300 NVL72 机架级系统的首次亮相,该系统由 NVIDIA 的 Blackwell Ultra GPU 架构提供动力。这个系统提供了突破性的性能,相比其前身 Hopper 架构,Llama 3.1 405B 模型的预训练速度提升了四倍以上,Llama 2 70B 模型的微调速度提升了近五倍。
这些性能提升归功于 Blackwell Ultra 的先进架构特性,包括能够执行 15 petaflops NVFP4 AI 计算的新 Tensor Cores 和 279GB 的 HBM3e 内存。该公司还引入了新的训练方法,以有效利用架构的 NVFP4 计算能力。
AI 训练精度的进步
NVIDIA 在这一基准测试中的成功可归因于其在 AI 训练中开创性地使用 NVFP4 精度——这是 MLPerf 历史上的首次。此方法允许架构在位数更少的数据上进行计算,在显著提高计算速度的同时保持精度。这一创新是 NVIDIA 更广泛战略的一部分,旨在优化 AI 模型以缩短训练时间。
创纪录的性能指标
NVIDIA 的 Blackwell GPUs 创造了新纪录,仅用 10 分钟便训练了 Llama 3.1 405B 模型,这要归功于超过 5,000 个 GPU 的高效扩展。这一壮举比以往的结果提升了 2.7 倍。此外,NVIDIA 在 Llama 3.1 8B 和 FLUX.1 模型上创下了新基准,强调了其在 AI 训练中持续创新的承诺。
行业合作与未来展望
NVIDIA 的合作伙伴生态系统,包括戴尔科技和惠普企业等知名科技公司,在取得这些成果中发挥了至关重要的作用。这种广泛的合作突显了 NVIDIA 技术的强大支持和可扩展性,推动了 AI 能力的快速进步。
随着 NVIDIA 继续快速创新,为 AI 采用和智能化的空前增长奠定了基础,铺平了 AI 训练和推理未来突破的道路。
Image source: Shutterstock