NVIDIA 发布了 DOCA 2.9,这是其数据中心基础设施框架的重大更新,旨在增强 AI 计算结构和云计算基础设施。根据 NVIDIA 的官方公告,最新版本在性能、安全性和可扩展性方面承诺提供重大改进。
AI 和云计算的增强
DOCA 2.9 引入了一套全面的软件框架,利用硬件加速,提高了效率和性能。更新包括在拥塞控制、遥测功能以及对 NVIDIA 的 Spectrum-X 1.2 参考架构的支持方面的改进。该架构提供了大规模扩展能力,支持在单一结构中多达 128,000 个 GPU,这对于 AI 工作负载至关重要。
DOCA 遥测库中的新功能允许高频采样,增强了针对 AI 驱动环境的网络监控。这提供了对网络性能的更细粒度的洞察,对于优化 AI 工作负载至关重要。
南北向连接和安全
更新还通过增强云资源与外部网络之间的连接,关注南北向云计算的改进。通过将 'tune' 性能分析工具集成到 DOCA Flow,用户可以前所未有地洞察他们的网络流配置。
现已普遍可用的 OVS-DOCA 引入了本地镜像功能,并在连接跟踪方面显著提升了性能,使其成为现代网络环境中传统解决方案的强大替代品。
高级安全和管理工具
DOCA 2.9 还通过增强 DOCA App Shield 库中的功能提高了安全性,为 Linux 环境提供了高级的容器监控功能。这有助于安全团队保持对容器化工作负载的警觉。
此外,DOCA 管理服务 (DMS) 已达到普遍可用性,提供了简化的设备管理功能,适用于 NVIDIA BlueField DPU 和 SuperNIC。这一更新通过支持节点重启时的配置持久性,使复杂环境中的操作更加简单。
面向未来的基础设施
通过 DOCA 2.9,NVIDIA 旨在为数据中心基础设施做好未来准备,为开发人员提供强大的工具,以优化应用程序和数据路径性能。该版本支持转向 DOCA-OFED,这是一个集成在 DOCA 框架内的统一网络堆栈,标志着 AI 和云基础设施开发的重要进步。
Image source: Shutterstock