NVIDIA 发布 Nemotron 3 Super 开源模型,1200 亿参数专为多智能体 AI 设计
NVIDIA 正式发布 Nemotron 3 Super,这是一款拥有 1200 亿参数、推理时仅激活 120 亿参数的开源大模型,专为大规模多智能体 AI 系统设计。该模型采用混合专家(MoE)架构,融合 Mamba 层与 Transformer 层,支持 100 万 token 上下文窗口,较上一代 Nemotron Super 模型吞吐量提升最高 5 倍、准确率提升最高 2 倍,并以开放权重形式在宽松许可协议下发布。
Perplexity、CodeRabbit、Factory、Greptile 等 AI 原生公司,以及 Amdocs、Palantir、Cadence、达索系统、西门子等企业软件平台已宣布集成或部署该模型。Nemotron 3 Super 现可通过 build.nvidia.com、Hugging Face、OpenRouter 及 Perplexity 访问,并将陆续上线 Google Cloud Vertex AI、Oracle Cloud Infrastructure、Amazon Bedrock 及 Microsoft Azure。