NVIDIA 的 Nemotron 3 Nano 现已在 Together AI 上线 - Blockchain.News

NVIDIA 的 Nemotron 3 Nano 现已在 Together AI 上线

realtime news Dec 15, 2025 15:17

NVIDIA 的 Nemotron 3 Nano,一款尖端推理模型,现已通过 Together AI 获取,为多代理系统提供增强性能。

NVIDIA 的 Nemotron 3 Nano 现已在 Together AI 上线

NVIDIA 的最新推理模型 Nemotron 3 Nano 已经在 AI Native Cloud 平台 Together AI 上发布,据 together.ai 透露。这一进展将提高 AI 工程师在构建更高效的代理系统方面的能力。

Nemotron 3 Nano 的特点

Nemotron 3 Nano 利用混合 Mamba-Transformer 和稀疏专家混合(MoE)架构。该设计结合了管理长范围依赖关系的 Mamba 层的优势,以及以通用推理和指令跟随能力著称的 Transformer 层。稀疏 MoE 架构每个 token 激活约 30 亿中的 3 亿参数,优化了速度并降低成本。

模型支持 100 万 token 的上下文,实现广泛的规划、资源密集型管道和持久的代理记忆。它包含开放的权重、训练数据和配方,使其可用于研究、企业和合规性部署。该模型在编码、科学推理和函数调用任务中表现出色。

在 Together AI 上的部署

Together AI 专为生产规模的推理和代理工作负载量身定制,是 Nemotron 3 Nano 理想的平台。它提供强大的性能,具备低延迟和高吞吐量,确保快速的多步骤推理而无瓶颈。平台还高效扩展并行工作负载,支持多代理编排和工具使用管道。

Together AI 强调可靠性,在高流量时保持一致的性能并确保高正常运行时间。这种可靠性对于涉及连续决策任务的应用至关重要。此外,平台通过利用模型高效的参数激活来提升成本效益,降低每代理步骤的成本。

平台的灵活性体现在其简单、开发者友好的 API 中,包括与 OpenAI 兼容的界面,便于集成到现有工作流和系统中。

应用场景和用例

Nemotron 3 Nano 特别适合 Together AI 生态系统中需求密集的推理应用。其能力有助于开发编码助手、科学推理代理和长上下文企业助手。该模型支持多步骤的工具使用和规划代理,其适用性扩展到各个行业。

开发者可以在 Together AI 上开始使用 Nemotron 3 Nano,并通过 Discord 等平台与社区互动,探索更多机会与合作。

Image source: Shutterstock