英伟达Nemotron Super 3发布：吞吐量提升五倍的智能体AI模型

张

张建站

2026/6/11 12:33:07

10分钟阅读

英伟达公司发布了其迄今为止能力最强的AI模型Nemotron Super 3。该模型旨在大规模运行复杂的智能体AI系统它将先进的推理能力与快速处理速度相结合以高效执行需要极高准确性的任务。Nemotron Super 3是一个基于混合专家架构的1200亿参数开放模型。英伟达表示它结合了三大创新实现了比上一代Nemotron Super模型高达五倍的吞吐量和两倍的准确性。据英伟达介绍Nemotron Super 3旨在解决智能体AI系统面临的两大主要限制。第一个限制是内容爆炸。多智能体工作流通常比标准聊天交互多生成高达15倍的token因为用户每次与智能体交互时模型都需要重新发送上下文包括工具输出和中间推理。第二个限制被称为**“思考税”**。复杂的智能体在完成任务的每一步都需要进行推理这使得使用更大的模型变得不切实际因为参数越多处理成本就越高。此外大模型也比小模型慢。为了解决这些问题Nemotron 3 Super拥有100万个token的上下文窗口使其能够在内存中保留完整的工作流状态并防止“目标漂移”。此外在其1200亿参数中推理期间只有120亿是激活的。推理是指运行训练好的模型以在新数据上生成预测或得出结论的过程。英伟达表示Nemotron Super 3在其Blackwell GPU上以NVFP4精度运行这使其内存需求降低推理速度相比上一代Hopper平台提升高达四倍。Nemotron 3 Super可从build.nvidia.com、OpenRouter和Hugging Face下载。此外AI搜索引擎某机构原文Perplexity Inc.正在其搜索引擎及其“计算机”AI智能体系统中提供该模型。CodeRabbit、Factory和Greptile等生成式AI编码应用程序也正在将该模型添加到其产品阵容中而生命科学组织Edison Scientific和Lila Sciences将使用它来为数据科学、深度文献研究和分子理解领域的智能体提供动力。包括某机构原文Amdocs group Co.、某机构原文Palantir Technologies Inc.、某机构原文Cadence Design Systems Inc.和某机构原文Dassault Systèmes SA在内的公司也正在使用Nemotron Super 3来自动化电信、网络安全、半导体设计和制造领域的工作流。最后某机构原文Dell Technologies Inc.和某机构原文Hewlett Packard Enterprise Co.也将通过其各自的智能体中心提供对该模型的访问。Nemotron 3 Super的发布正值英伟达年度GTC大会前夕该大会将于下周3月16日开幕届时该公司预计将公布有关其下一代GPU平台的更多信息。FINISHED更多精彩内容请关注我的个人公众号公众号办公AI智能小助手或者我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享