NVIDIA 的 cuDSS 颠覆大型稀疏问题求解

realtime news Dec 18, 2025 03:17 UTC 19:17

1 Min Read

在电子设计自动化（EDA）和计算流体动力学（CFD）等快速发展的领域中，模拟和设计的复杂性需要先进的解决方案来处理大型线性稀疏问题。根据 NVIDIA 博客的说法，NVIDIA 的 CUDA 直接稀疏求解器 (cuDSS) 成为一款关键工具，使用户能够以前所未有的可扩展性和效率应对这些挑战。

通过混合内存模式增强功能

NVIDIA 的 cuDSS 通过其混合内存模式允许用户同时利用 CPU 和 GPU 资源，从而脱颖而出。此功能使得可以处理超过单个 GPU 内存容量的更大问题。尽管 CPU 和 GPU 之间的数据传输会引入一些延迟，但 NVIDIA 驱动程序和先进互联技术（例如在 NVIDIA Grace Blackwell 节点中）的优化减少了性能影响。

混合内存模式默认未启用。用户必须在执行分析阶段前通过 cudssConfigSet() 函数激活它。该模式会自动管理设备内存，但用户可以指定内存限制以进一步优化性能。

多 GPU 利用提升效率

为满足更大问题规模或加速计算，cuDSS 提供了多 GPU 模式（MG 模式）。此模式允许使用单个节点中的所有 GPU，消除了开发人员手动管理分布式通信的需要。目前，MG 模式对 Windows 上的应用程序特别有益，因为 CUDA 的 MPI 感知通信存在局限。

MG 模式通过在多个 GPU 上分配工作负载来增强可扩展性，显著减少计算时间。当问题规模超过单个 GPU 的能力或需要避免混合内存模式的性能损失时，它特别有用。

通过多 GPU 多节点（MGMN）模式进一步扩展

对于单节点能力不足的情况，NVIDIA 推出了多 GPU 多节点（MGMN）模式。此模式利用可调的通信层来适应 CUDA 感知的 Open MPI、NVIDIA NCCL 或自定义解决方案，实现在多个节点上的广泛可扩展性。

MGMN 模式支持输入矩阵和解的 1D 行分配，提高了解算器管理分布式计算的能力。尽管此模式显著扩展了潜在问题规模并加速了处理，但需要仔细配置以优化 CPU:GPU:NIC 绑定。

结论

NVIDIA 的 cuDSS 为应对各种科学和工程学科的大型稀疏问题需求提供了强大的框架。通过提供混合内存和多 GPU 模式等灵活的解决方案，cuDSS 使开发人员能够有效地扩展他们的计算。有关 cuDSS 功能的更多详细信息，请访问 [NVIDIA 的博客](https://developer.nvidia.com/blog/solving-large-scale-linear-sparse-problems-with-nvidia-cudss/)。

News ▸

NVIDIA 的 cuDSS 颠覆大型稀疏问题求解

通过混合内存模式增强功能

多 GPU 利用提升效率

通过多 GPU 多节点（MGMN）模式进一步扩展

结论

Read More

NVIDIA's cuDSS Revolutionizes Large-Scale Sparse Problem Solving

VeChain's Hayabusa Upgrade Aligns With MiCA for Institutional Blockchain Adoption

Sei Network Unveils Market Infrastructure Grid to Revolutionize Global Markets

Bitcoin (BTC) Faces Overhead Supply Challenges Amid Range-Bound Market

2025 Policy Shifts Pave Way for Crypto Innovations in 2026