NVIDIA 在 MLPerf Training v5.1 中凭借 Blackwell Ultra GPU 取得主导地位
NVIDIA 再次展示了其在 AI 训练性能方面的主导地位,在最新的 MLPerf Training v5.1 基准测试中横扫所有七项测试。根据 NVIDIA 的博客,该公司在各类 AI 模型类别中展示了最快的训练时间,包括大语言模型 (LLMs)、图像生成、推荐系统、计算机视觉和图神经网络。
Blackwell Ultra 的精彩首秀
本轮的亮点是 GB300 NVL72 机架级系统的首次亮相,该系统由 NVIDIA 的 Blackwell Ultra GPU 架构提供动力。这个系统提供了突破性的性能,相比其前身 Hopper 架构,Llama 3.1 405B 模型的预训练速度提升了四倍以上,Llama 2 70B 模型的微调速度提升了近五倍。
这些性能提升归功于 Blackwell Ultra 的先进架构特性,包括能够执行 15 petaflops NVFP4 AI 计算的新 Tensor Cores 和 279GB 的 HBM3e 内存。该公司还引入了新的训练方法,以有效利用架构的 NVFP4 计算能力。
AI 训练精度的进步
NVIDIA 在这一基准测试中的成功可归因于其在 AI 训练中开创性地使用 NVFP4 精度——这是 MLPerf 历史上的首次。此方法允许架构在位数更少的数据上进行计算,在显著提高计算速度的同时保持精度。这一创新是 NVIDIA 更广泛战略的一部分,旨在优化 AI 模型以缩短训练时间。
创纪录的性能指标
NVIDIA 的 Blackwell GPUs 创造了新纪录,仅用 10 分钟便训练了 Llama 3.1 405B 模型,这要归功于超过 5,000 个 GPU 的高效扩展。这一壮举比以往的结果提升了 2.7 倍。此外,NVIDIA 在 Llama 3.1 8B 和 FLUX.1 模型上创下了新基准,强调了其在 AI 训练中持续创新的承诺。
行业合作与未来展望
NVIDIA 的合作伙伴生态系统,包括戴尔科技和惠普企业等知名科技公司,在取得这些成果中发挥了至关重要的作用。这种广泛的合作突显了 NVIDIA 技术的强大支持和可扩展性,推动了 AI 能力的快速进步。
随着 NVIDIA 继续快速创新,为 AI 采用和智能化的空前增长奠定了基础,铺平了 AI 训练和推理未来突破的道路。
Read More
NVIDIA Blackwell Leads MLPerf Training v5.1 with Record-Breaking Performance
Nov 13, 2025 1 Min Read
NVIDIA Dominates MLPerf Training v5.1 with Blackwell Ultra GPUs
Nov 13, 2025 1 Min Read
Bitcoin (BTC) Faces Resistance Amidst Cautious Market Dynamics
Nov 13, 2025 1 Min Read
EigenZero: Strengthening Cross-Chain Security with EigenCloud and LayerZero
Nov 13, 2025 1 Min Read