NVIDIA发布Nemotron 3：AI模型效率与准确性的创新

realtime news Dec 15, 2025 22:54 UTC 14:54

1 Min Read

NVIDIA宣布发布Nemotron 3，这是一项在AI系统上的重大进步，旨在提高自主性AI模型的效率和准确性。根据NVIDIA的说法，Nemotron 3系列包括三种变体——Nano、Super和Ultra——每种变体都配备了专用于现代AI应用的专用数据集和技术。

AI架构的突破

Nemotron 3模型引入了混合Mamba-Transformer专家混合(MoE)架构。这种创新方法集成了用于高效序列建模的Mamba层、用于精确推理的Transformer层以及优化计算效率的MoE路由。这种组合使模型能够以最小的延迟处理大规模数据，使其非常适合需要长距离推理和深度多文档分析的应用。

强化学习与上下文理解

Nemotron 3利用强化学习在各种互动环境中训练，以使模型与真实世界的自主行为对齐。这种训练方法增强了模型执行复杂动作序列的能力，例如生成工具调用和编写功能代码。扩展的1M-token上下文窗口进一步支持在大数据集上的持续推理，使全面分析得以实现，而不会出现上下文片段化。

Nemotron 3 Super和Ultra的未来增强

预计在2026年上半年发布的Super和Ultra版本将引入潜在MoE，使每个token可以激活更多的专家，并提供多token预测（MTP），以提高吞吐量。这些模型还将利用NVIDIA的NVFP4训练格式，承诺在模型训练和推理中实现更高的准确性和效率。

对开放AI开发的承诺

NVIDIA通过在NVIDIA Open Model License下发布模型权重继续其对透明性和开发者赋权的承诺。开发者可以通过Nemotron GitHub库获取详细的训练和后训练方案，使他们能够为特定应用定制和复制模型。

Nemotron 3 Nano现已推出，为高吞吐量、长上下文自主性系统提供基础。开发者可以利用NVIDIA的开放数据集和工具来训练和微调他们的模型，促进AI社区的创新和合作。

更多详情，请访问NVIDIA博客。

News ▸

NVIDIA发布Nemotron 3：AI模型效率与准确性的创新

AI架构的突破

强化学习与上下文理解

Nemotron 3 Super和Ultra的未来增强

对开放AI开发的承诺

Read More

Enhancing AI Models: Fine-Tuning LLMs on NVIDIA GPUs with Unsloth

NVIDIA Unveils Nemotron 3: Innovations in AI Model Efficiency and Accuracy

NVIDIA Unveils Nemotron 3: A New Era for Open AI Models

Leveraging Reinforcement Learning for Scientific AI Agents

Ripple USD (RLUSD) Expands with Wormhole's NTT on Layer 2 Networks