黄仁勋官宣超强开源大模型!速度狂飙5倍、成本降30%,长效AI智能体变天

2026-06-05

关注CAIE,国内头部AI人才认证、培训体系,助你在职场升职加薪。
CAIE注册人工智能工程师
CAIE注册人工智能工程师
公众号作者
CAIE,全称 Certifed Artifcial Intelligence Engineer(人工智能工程师),简称 CAIE(赛一) ,是人工智能领域的技能等级认证。旨在评估和培养具备人工智能理论基础与实战能力的职业人士。

英伟达刚刚又搞了个大动静,黄仁勋亲自站台官宣的开源大模型Nemotron 3 Ultra来了。

这次最大亮点不是单纯的参数升级,而是专门为长效AI智能体量身优化的模型。

简单说就是让AI不再只会单次对话,能长期自主干活、搞定复杂工作。目前已经有不少知名企业,在实际业务中使用这个模型了。

更良心的是,这次英伟达直接玩了一手全链路开源。模型权重、完整数据集、训练调优方案全部公开,没有多余限制,开发者可以自由微调、二次开发、自定义适配各类场景,自由度拉满。

黄仁勋在发布会上官宣

开源地址:https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

估计很多人还不太懂长效AI智能体和普通AI的区别,这里先简单的给大家科普一下。

我们平时用的普通大模型,大多是一问一答,输出完内容任务就结束了。

但现实里的工作远比问答复杂,不管是写完整的项目代码、梳理上百份行业资料,还是处理环环相扣的企业业务,都需要AI持续思考、分步规划、主动调用工具,遇到问题自行调整方案,反复迭代直到完成任务。

这类复杂工作对AI的效率和精准度要求极高,而英伟达这次开源的新模型,就是专门解决这类痛点的。

相比传统模型,Nemotron 3 Ultra的推理速度直接提升5倍,在处理各类复杂智能体工作时,整体使用成本还能降低30%

这模型底子特别厚实,是个拥有5500亿参数的混合专家架构,综合思考能力极强。

面对超长的编程项目架构设计、海量资料的整合梳理、多条复杂约束条件的交叉核对这类高难度工作,都能稳稳拿捏。算是目前企业级复杂AI工作流的优质解决方案。

说太多参数、理论也无法体现一个模型好不好用,咱们看下头部企业的选择就知道。

智能数据服务企业Aible,借助这款模型帮助各行各业的客户搭建安全又稳定的长效AI智能体,实现规模化商用。

企业智能检索平台Glean,则把新模型融入自身的智能调度系统,搭配轻量化模型优化检索能力,让中小企业也能低成本用上专业的企业级AI检索功能。

我们熟知的AI搜索产品Perplexity,也全面用上了这款模型,用来优化站内搜索和智能办公功能。

确定要退出登录吗?
确定 取消