NVIDIA发布Nemotron 3:AI模型效率与准确性的创新

realtime news   Dec 15, 2025 22:54  UTC 14:54

1 Min Read

NVIDIA宣布发布Nemotron 3,这是一项在AI系统上的重大进步,旨在提高自主性AI模型的效率和准确性。根据NVIDIA的说法,Nemotron 3系列包括三种变体——Nano、Super和Ultra——每种变体都配备了专用于现代AI应用的专用数据集和技术。

AI架构的突破

Nemotron 3模型引入了混合Mamba-Transformer专家混合(MoE)架构。这种创新方法集成了用于高效序列建模的Mamba层、用于精确推理的Transformer层以及优化计算效率的MoE路由。这种组合使模型能够以最小的延迟处理大规模数据,使其非常适合需要长距离推理和深度多文档分析的应用。

强化学习与上下文理解

Nemotron 3利用强化学习在各种互动环境中训练,以使模型与真实世界的自主行为对齐。这种训练方法增强了模型执行复杂动作序列的能力,例如生成工具调用和编写功能代码。扩展的1M-token上下文窗口进一步支持在大数据集上的持续推理,使全面分析得以实现,而不会出现上下文片段化。

Nemotron 3 Super和Ultra的未来增强

预计在2026年上半年发布的Super和Ultra版本将引入潜在MoE,使每个token可以激活更多的专家,并提供多token预测(MTP),以提高吞吐量。这些模型还将利用NVIDIA的NVFP4训练格式,承诺在模型训练和推理中实现更高的准确性和效率。

对开放AI开发的承诺

NVIDIA通过在NVIDIA Open Model License下发布模型权重继续其对透明性和开发者赋权的承诺。开发者可以通过Nemotron GitHub库获取详细的训练和后训练方案,使他们能够为特定应用定制和复制模型。

Nemotron 3 Nano现已推出,为高吞吐量、长上下文自主性系统提供基础。开发者可以利用NVIDIA的开放数据集和工具来训练和微调他们的模型,促进AI社区的创新和合作。

更多详情,请访问NVIDIA博客



Read More