熱門資訊> 正文
2025-12-15 14:00
NVIDIA Nemotron 3
新闻摘要:
加州圣克拉拉,2025 年 12 月 15 日(GLOBE NEWSWIRE)——NVIDIA 今日宣布推出 NVIDIA Nemotron™ 3 系列开放模型、数据和库,旨在为各行业的透明、高效和专业化的智能体 AI 开发提供支持。
Nemotron 3 型号(有 Nano、Super 和 Ultra 三种尺寸)引入了一种突破性的混合潜在专家混合 (MoE)架构,可帮助开发人员大规模构建和部署可靠的多智能体系统。
随着企业从单一模型聊天机器人转向协作式多智能体人工智能系统,开发者面临着日益严峻的挑战,包括通信开销、上下文漂移和高昂的推理成本。此外,开发者需要透明度来信任那些将自动化其复杂工作流程的模型。Nemotron 3 直接应对这些挑战,提供客户构建专业化、智能体人工智能所需的性能和开放性。
英伟达创始人兼首席执行官黄仁勋表示:“开放式创新是人工智能进步的基石。通过Nemotron,我们正在将先进的人工智能转变为一个开放平台,为开发者提供构建大规模智能体系统所需的透明度和效率。”
NVIDIA Nemotron 支持 NVIDIA 更广泛的自主 AI 工作,从欧洲到韩国的组织都采用了开放、透明和高效的模型,使他们能够构建符合自身数据、法规和价值观的 AI 系统。
包括埃森哲、Cadence、CrowdStrike、Cursor、德勤、安永、Oracle 云基础设施、Palantir、Perplexity、ServiceNow、西门子、Synopsys 和 Zoom 在内的早期采用者,正在整合 Nemotron 系列模型,以支持制造业、网络安全、软件开发、媒体、通信和其他行业的 AI 工作流程。
ServiceNow董事长兼首席执行官比尔·麦克德莫特表示:“NVIDIA和ServiceNow多年来一直在塑造人工智能的未来,而最好的还在后头。今天,我们迈出了重要一步,助力各行各业的领导者加速推进其智能AI战略。ServiceNow的智能工作流自动化与NVIDIA Nemotron 3的结合,将继续以无与伦比的效率、速度和准确性树立行业标杆。”
随着多智能体人工智能系统的扩展,开发者越来越依赖专有模型来实现最先进的推理,同时利用更高效、更可定制的开放模型来降低成本。在单一工作流程中,将任务在先进模型和Nemotron之间路由,既能赋予智能体最大的智能,又能优化代币经济学。
“Perplexity 的理念是,将精准的人工智能技术融入卓越的工具(例如人工智能助手)中,能够极大地激发人类的好奇心,”Perplexity 首席执行官 Aravind Srinivas 表示。“借助我们的代理路由系统,我们可以将工作负载定向到经过最佳微调的开放模型(例如 Nemotron 3 Ultra),或者在任务需要时利用领先的专有模型,从而确保我们的人工智能助手能够以卓越的速度、效率和规模运行。”
开放的 Nemotron 3 模型使初创公司能够更快地构建和迭代 AI 代理,并加速从原型到企业部署的创新进程。General Catalyst 和 Mayfield 的投资组合公司正在探索使用 Nemotron 3 来构建支持人机协作的 AI 伙伴。
Mayfield 管理合伙人 Navin Chaddha 表示:“NVIDIA 的开放模型堆栈和 NVIDIA Inception 项目为早期公司提供了模型、工具和经济高效的基础设施,帮助他们进行实验、实现差异化并快速扩展。Nemotron 3 让创始人能够快速构建智能 AI 应用和 AI 团队成员,并帮助他们利用 NVIDIA 庞大的用户群。”
Nemotron 3 以高效和精准的方式重新定义了多智能体人工智能
Nemotron 3 系列MoE 型号包括三种尺寸:
Nemotron 3 Nano现已上市,是目前计算成本最低的模型,针对软件调试、内容摘要、AI助手工作流程和信息检索等任务进行了优化,推理成本极低。该模型采用独特的混合MoE架构,显著提升了效率和可扩展性。
与 Nemotron 2 Nano 相比,该设计实现了高达 4 倍的令牌吞吐量提升,并将推理令牌生成量减少了高达 60%,从而显著降低了推理成本。凭借 100 万个令牌的上下文窗口,Nemotron 3 Nano 能够记住更多信息,使其更加精准,并能更好地连接长时间、多步骤任务中的信息。
人工智能分析(Artificial Analysis)是一家对人工智能进行基准测试的独立机构,该机构将该模型评为同等规模模型中最开放、最高效的模型,并具有领先的准确率。
Nemotron 3 Super 擅长处理需要众多智能体协作以低延迟完成复杂任务的应用。Nemotron 3 Ultra 则是一款高级推理引擎,适用于需要深度研究和战略规划的 AI 工作流程。
Nemotron 3 Super 和 Ultra 采用 NVIDIA Blackwell 架构上的 NVIDIA 超高效 4 位 NVFP4 训练格式,显著降低了内存需求并加快了训练速度。这种高效性使得在现有基础设施上训练更大的模型成为可能,同时又不会像更高精度格式那样降低精度。
借助 Nemotron 3 系列模型,开发人员可以选择适合其特定工作负载的开放模型,从几十个代理扩展到几百个代理,同时受益于更快、更准确的长期推理,从而处理复杂的工作流程。
用于人工智能代理定制的新开放工具和数据
NVIDIA 还发布了一系列训练数据集和最先进的强化学习库,供任何构建专用 AI 代理的人使用。
包含三万亿个令牌的全新 Nemotron 预训练、 后训练和强化学习数据集提供了丰富的推理、编码和多步骤工作流示例,可用于创建功能强大、领域专业化的智能体。Nemotron 智能体安全数据集提供真实世界的遥测数据,帮助团队评估和加强复杂智能体系统的安全性。
为了加速开发,NVIDIA 发布了NeMo Gym和NeMo RL开源库,它们为 Nemotron 模型提供训练环境和训练后处理基础,同时还发布了 NeMo Evaluator 用于验证模型的安全性和性能。所有工具和数据集现已在 GitHub 和 Hugging Face 上提供。
Nemotron 3 支持LM Studio 、llama.cpp、 SGLang和vLLM 。此外,Prime Intellect 和Unsloth正在将 NeMo Gym 的即用型训练环境直接集成到他们的工作流程中,使团队能够更快、更轻松地访问强大的强化学习训练。
NVIDIA Open Models 入门
Nemotron 3 Nano 现已在Hugging Face上推出,并通过Baseten 、 DeepInfra 、 Fireworks 、 FriendliAI 、OpenRouter 和Together AI等推理服务提供商提供。
Nemotron 可在企业级 AI 和数据基础设施平台上使用,包括 Couchbase、DataRobot、H2O.ai、JFrog、Lambda 和 UiPath。对于公有云客户,Nemotron 3 Nano 将通过 Amazon Bedrock(无服务器)在 AWS 上提供,并且很快将支持 Google Cloud、CoreWeave、Crusoe、Microsoft Foundry、 Nebius 、Nscale 和 Yotta。
Nemotron 3 Nano 可作为NVIDIA NIM™ 微服务提供,可在 NVIDIA 加速的基础架构上的任何位置进行安全、可扩展的部署,从而最大限度地保护隐私和控制权。
Nemotron 3 Super 和 Ultra 预计将于 2026 年上半年上市。
关于 NVIDIA
英伟达(NASDAQ:NVDA)是人工智能和加速计算领域的全球领导者。
如需了解更多信息,请联系:
娜塔莉·赫雷斯
英伟达公司
nhereth@nvidia.com
本新闻稿中的某些陈述,包括但不限于以下陈述:NVIDIA 通过 Nemotron 将先进的 AI 转化为一个开放平台,为开发者提供构建大规模智能体系统所需的透明度和效率;NVIDIA 产品、服务和技术的优势、影响、性能和可用性;NVIDIA 与第三方(包括其合作方和合作伙伴)的安排的预期;技术发展的预期;以及其他非历史事实的陈述,均属于经修订的 1933 年《证券法》第 27A 条和经修订的 1934 年《证券交易法》第 21E 条所界定的前瞻性陈述。这些陈述受上述条款所设立的“安全港”条款的保护,基于管理层的信念和假设以及管理层目前可获得的信息,但存在风险和不确定性,可能导致实际结果与预期存在重大差异。可能导致实际结果与预期存在重大差异的重要因素包括:全球经济和政治状况; NVIDIA依赖第三方进行产品的制造、组装、包装和测试;技术发展和竞争的影响;新产品和新技术的开发或对NVIDIA现有产品和技术的改进;NVIDIA产品或其合作伙伴产品的市场接受度;设计、制造或软件缺陷;消费者偏好或需求的变化;行业标准和接口的变化;NVIDIA产品或技术集成到系统后出现意外的性能损失;以及适用法律法规的变化,以及NVIDIA不时向美国证券交易委员会(SEC)提交的最新报告中详述的其他因素,包括但不限于其10-K表年度报告和10-Q表季度报告。提交给SEC的报告副本发布在公司网站上,也可从NVIDIA免费获取。这些前瞻性声明并非对未来业绩的保证,仅代表截至本文发布之日的情况,除法律要求外,NVIDIA 不承担任何更新这些前瞻性声明以反映未来事件或情况的义务。
本文所述的许多产品和功能仍处于不同阶段,并将视具体情况而定。以上声明并非承诺、保证或法律义务,也不应被解释为承诺、保证或法律义务。我们产品的任何特性或功能的开发、发布和时间安排均可能变更,且最终解释权归 NVIDIA 所有。NVIDIA 对未能交付或延迟交付本文所述的任何产品、特性或功能不承担任何责任。
© 2025 NVIDIA 公司。保留所有权利。NVIDIA、NVIDIA 徽标、NVIDIA Nemotron 和 NVIDIA NIM 是 NVIDIA 公司在美国和其他国家/地区的商标和/或注册商标。其他公司和产品名称可能是其各自关联公司的商标。功能、价格、供货情况和规格如有变更,恕不另行通知。
本公告附带的照片可在以下网址查看:https://www.globenewswire.com/NewsRoom/AttachmentNg/e4e1adc9-3143-4350-8782-34f67ef66650