2026-06-05
英伟达刚刚又搞了个大动静,黄仁勋亲自站台官宣的开源大模型Nemotron 3 Ultra来了。
这次最大亮点不是单纯的参数升级,而是专门为长效AI智能体量身优化的模型。
简单说就是让AI不再只会单次对话,能长期自主干活、搞定复杂工作。目前已经有不少知名企业,在实际业务中使用这个模型了。
更良心的是,这次英伟达直接玩了一手全链路开源。模型权重、完整数据集、训练调优方案全部公开,没有多余限制,开发者可以自由微调、二次开发、自定义适配各类场景,自由度拉满。
黄仁勋在发布会上官宣
开源地址:https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
估计很多人还不太懂长效AI智能体和普通AI的区别,这里先简单的给大家科普一下。
我们平时用的普通大模型,大多是一问一答,输出完内容任务就结束了。
但现实里的工作远比问答复杂,不管是写完整的项目代码、梳理上百份行业资料,还是处理环环相扣的企业业务,都需要AI持续思考、分步规划、主动调用工具,遇到问题自行调整方案,反复迭代直到完成任务。
这类复杂工作对AI的效率和精准度要求极高,而英伟达这次开源的新模型,就是专门解决这类痛点的。

相比传统模型,Nemotron 3 Ultra的推理速度直接提升5倍,在处理各类复杂智能体工作时,整体使用成本还能降低30%。
这模型底子特别厚实,是个拥有5500亿参数的混合专家架构,综合思考能力极强。
面对超长的编程项目架构设计、海量资料的整合梳理、多条复杂约束条件的交叉核对这类高难度工作,都能稳稳拿捏。算是目前企业级复杂AI工作流的优质解决方案。

说太多参数、理论也无法体现一个模型好不好用,咱们看下头部企业的选择就知道。
智能数据服务企业Aible,借助这款模型帮助各行各业的客户搭建安全又稳定的长效AI智能体,实现规模化商用。
企业智能检索平台Glean,则把新模型融入自身的智能调度系统,搭配轻量化模型优化检索能力,让中小企业也能低成本用上专业的企业级AI检索功能。
我们熟知的AI搜索产品Perplexity,也全面用上了这款模型,用来优化站内搜索和智能办公功能。

登录/注册后继续阅读
立即登录/注册 >