GTC 2026,主角不再是GPU。黄仁勋用一整场宣布会证实:英伟达的疆场已经转移。

以前十年,英伟达用CUDA生态和Tensor Core,将GPU推至AI计算的中间肠位,GPU既是练习引擎,也是推理主力,包办一切。

而在这场被视为AI基本举措措施风向标的宣布会上,叙事重心开端从“更强的GPU”,转向“若何组织算力”。

从Vera Rubin平台,到LPX推理机架,再到尚未完全展开的Feynman架构,一条清楚的主线逐渐浮现:AI正在从以练习为中间的阶段,过渡到以推理为核心的阶段,而对应的基本举措措施,也产生了从通用走向分工的变更。

——芯片家当人士姚金鑫(J叔)

数据中间也被从新定义为“AI工厂”,衡量标准也从单卡机能,转向Token产出效力。

Vera与Rosa的表态,合营超节点架构中CPU配比的明显晋升,标记住英伟达正将Agentic AI的爆发视为架构重构的核心变量,其CPU叙事的核心,是AI工厂内部的算力编排权,而非与其他厂商竞争,短期内对x86格局难有本质冲击。

但这套新叙事也留下一串未解的追问:LPU的入场是否宣布推理不是GPU的主场?专用架构与通用算力若何分层共处?Token可否真正成为AI时代的硬通货?而英伟达从"算力垄断"转向"生态闭环"的回身,毕竟是前瞻构造,照样存量优势的被动戍守?更多家当洞察,迎接添加微信 YONGGANLL6662 交换商量。


为了厘清这场变局的技巧逻辑与市场动因,我们和多位家当专家及投资人深度交换之后,获得了在英伟达新叙事之下家当里的不合与共鸣。

同时,我们也特邀3位行业顶级专家,于3月19日11:30开讲,对GTC 2026进行深度解析,全方位拆解算力家当的核心趋势、投资机会与破局偏向,迎接锁定视频号“雷峰网”、“AI 科技评论”直播间,共探家当新局。吗?01

LPU入局,GPU不是推理时代的「主角」了吗?

在GTC 2026上,黄仁勋再次重申了他对AI基本举措措施演进的断定:“AI正从‘模型练习时代’加快迈入‘模型推理时代’,全部AI技巧栈的组织方法,都开端被从新定义。”

在AI进入推理的时代,英伟达更新了“全家桶”,包含Vera Rubin平台、LPX推理机架以及代号为Feynman架构在内的一整套新叙事,从单一GPU主导,转向多处理器协同的“AI工厂”。

假如说以前十年,GPU是AI时代当之无愧的“主角”,那么在这套新蓝图中,GPU不再试图包办一切,而是与CPU、LPU及专用推理单位合营构成分层分工的计算体系。英伟达正在主动拆解“通用算力”的神话,并试图用更复杂但更高效的架构,去承接一个以推理为中间、以Agent为核心的新周期。关于这一周期的更多深度解读与行业动态,迎接添加微信 EATINGNTAE 交换商量。

雷峰网采访的业内专家对此分析道:

LPU的推出,在必定程度上,是英伟达承认GPU并非推理最优解。并且,理论上专用推理场景可完全离开GPU,但英伟达仍将LPU与GPU绑缚组合,既是生态延续,也避免对原有路线的“打脸”。在市场层面,头部大年夜厂推理需求仍会果断走向自研与ASIC路线,寻求能效与成本自立可控。英伟达GPU+LPU筹划,重点客户可能是中小互联网客户。

——芯片家当专家张翔


在Transformer推理中,Prefill、Decode、Orchestration三个阶段开端由不合硬件承担,LPX的出现,本质上是对Decode阶段的一次专门优化。GPU依然是练习和复杂推理的最优解,但在低延迟推理这个细分赛道上,专用架构开端显示出优势。GPU不会被LPX代替,而是各司其职。

——芯片家当人士姚金鑫(J叔)


如今市场上LPU的呼声很高,但其短期内难以成为英伟达疆土中的主力。黄仁勋在演讲的过程中一向强调的是LPU的机能,确不清楚其售价,所以LPU的经济性存疑,其单芯片集成500MB片上SRAM,而SRAM的价格平日是HBM的6-8倍,这必定会举高LPU的成本,并且受限于对象链融合的滞后性,其更多扮演推理场景的弥补角色。

——资深家当研究员刘雨嫣

雷峰网采访的业内专家对此分析道:


LPX的入场不必定宣布GPU推理时代的终结,而是推理义务分层化的旌旗灯号,GPU仍坐镇复杂推理与视频生成等算力密集型阵地,LPX则专攻低延迟、轻算力的细分场景。将来数据中间的图景是多元处理器各安其位,GPU“全能选手”退位,推理霸权让位于专业化分工。

CPX未被说起很让人不测,此前业内大年夜部分不雅点认为此次宣布会是CPX负责Prefill、LPU负责Decode的组合,从道理上看,Prefill不依附显存、Decode更吃显存,CPX和LPU本应是最优解,是以本次完全不提CPX,让人有些不测。

——分析师李维


此外,从体系架构的角度来看,Vera CPU的推出对x86影响同样有限,Vera是面向AI推理与练习设计的专用计算单位,而x86作为通用计算架构,仍要承载操作体系、数据库及海量传统软件的运行。Arm的精简指令集正好契合AI场景的需求,不须要兼容过往几十年的软件栈,可以砍掉落冗余逻辑,专注于高机能计算本身。

——芯片家当专家孙旭



——分析师张楠

Token成本全球最低,英伟达就能吞下「1万亿美元」?

“推理拐点已经到来。”GTC 2026上,黄仁勋这句话宣布,Token已成为新的硬通货。

黄仁勋认为,数据中间不再是仓库,而是临盆Token的“AI工厂”,每瓦吞吐量决定逝世活。而英伟达的Token成本全球最低,即便敌手架构免费,面对英伟达也没有性价比。他算了一笔账:建一个1GW工厂,空转15年摊销就达400亿美元,所以必须运行最强的体系才能摊薄成本。

基于这套逻辑,他抛出了一个让人沸腾的数字:“到2027年AI芯片营收将至少达到1万亿美元。”比拟客岁猜测翻倍,因为“以前两年计算需求增长了一百万倍。”

而1万亿美元这一数字,还只覆盖Blackwell和Vera Rubin两条产品线,若叠加CPU、Groq、存储及收集设备,这一范围或将达到1.25万亿美元。

当“全球最低Token成本”成为护城河,这套经济学真能支撑1万亿美元营收吗?

雷峰网采访的业内专家对此分析道:

当黄仁勋把“Tokens/W”作为衡量AI工厂产出的核心度量衡时,其实背后还有一层更重要的家当深意,算力竞争的度量体系,正在从芯片走向体系,从峰值参数走向端到端能效。从某种程度上,GTC 2026公开验证了这种体系视角,因为当NVIDIA本身都开端把叙事中间放到AI Factory上时,行业就已经在从AI计算芯片中间主义走向计算体系中间主义。

基于这个逻辑,我认为英伟达今朝的估值并不高,甚至偏低。它卖的是全部体系,在体系级优化上,没有谁能比它做得更好。独一可能构成竞争的敌手照样谷歌TPU,其他厂商根本追不上,这个格局到如今也没变。


——九章云极技巧专家陈昊

从国内算力市场格局来看,英伟达此番推理性价比优势,对本土市场冲击有限,国产替代的核心叙事逻辑依旧稳定,并不会是以产生动摇。


英伟达的护城河正在从“算力垄断”转向“生态闭环”。以前一年,其计谋重心明显上移——经由过程绑定上游自力供给商与下流AI数据中间,构建垂直整合的家当链控制力,既对冲大年夜厂自研芯片的替代风险,又以体系级交付举高竞争门槛。但经久盈利才能仍面对构造性压力,英伟达终将回归高端制造业的常态利润区间,只是时光日夕问题。

——分析师李维


AI已从聊天机械人进级为驱动社会临盆力的核心引擎,Token是驱动AI运转的基本要素,如同电力之于工业时代,阿里、英伟达等巨擘意在成为AI时代的能源工厂。将来AI竞争的关键在于Token临盆才能,具备范围化Token临盆才能的企业,才能在AI竞争中占据优势。大年夜模型练习仅占用少量算力,推理环节才是算力消费的主力,需持续生成Token,Token的成本高低直接决定AI的普及与社会渗入渗出程度。类比移动互联网边际成本为零的范围效应,只有Token成本降至如水、电般低廉、可被通俗用户轻松包袱,AI时代才会真正周全到来。

——分析师张楠

CPO的delay裸露了英伟达的技巧困局,铜互联带宽见顶、光互联推动受阻,双线均遭受机能瓶颈。此外,英伟达的存量生态,不仅是优势,同时也是包袱,其为守住既有优势,体系堆叠愈发过重,框架性立异让位于渐进式改进,这种“路径依附式”的戍守策略,很难成为在本钱市场上的利好。

NVLink6、CPO登场,透着英伟达的「焦炙」

英伟达在Vera Rubin平台上安排了第六代NVLink互连架构,实现GPU之间的高速扩大连接。

与此同时,英伟达还推出了全球首个CPO光电共封装的Spectrum-X以太网交换机,经由过程与台积电合作的CoWoS先辈封装技巧,将光引擎直接集成于交换芯片封装体内,实现电旌旗灯号与光旌旗灯号的片上直转,今朝已进入量产阶段。

阿里成立ATH、英伟达GTC也将Token视为接下来的营业核心,两大年夜巨擘的同时发力证实,行业的核心争夺,恰是Token的临盆、计量与分派主导权。Token全链路效力直接决定AI家当的经济性,谁能控制最低的Token临盆成本与最高效的流转体系,谁就控制将来十年的家当订价权。如同电力时代的电网、互联网时代的带宽,AI时代正环绕Token的创造、输送与应用,正在形成一个范围潜力远超想象的全新家当生态。

黄仁勋在主题演讲中表示,跟着AI模型体量指数级增长、智能体推理需求周全爆发,将来数据中间将进化为一台单机架级超等计算机越来越像一台超等计算机。关于这些前沿技巧若何重塑AI基本举措措施,迎接添加微信 EATINGNTAE 深刻交换。

雷峰网("大众,"号:雷峰网)采访的业内专家对此分析道:

英伟达正以Vera CPU、Rubin GPU、NVLink 6、ConnectX-9、BlueField-4、Spectrum-6与Groq 3 LPU的“全家桶”组合重构体系解决筹划,叙事重心从单颗芯片转向体系级交付。此外,英伟达还在测验测验构建联盟,成员包含台积电、美光、三星、海力士甚至英特尔等企业,试图以联盟策略锁定先辈封装与存储资本,这也恰好裸露了英伟达的焦炙:如斯复杂的产品矩阵,仍未能追平谷歌简洁架构的效能。

谷歌以7nm的ASIC,以及OCS与以太网的极简组合,实现Token成本与吞吐效力的双重领先,组网范围轻松冲破NVL72的天花板。当敌手用“减法”定义下一代基本举措措施,英伟达的“加法”生态反而成为范围扩大的包袱。

——资深家当研究员刘雨嫣


当前两大年夜变数值得存眷:一是跟着家当变革,关键厂商开端沿着价值链整合;二是受地缘政治影响,从中国大年夜陆向外转移模块产能。近期,英伟达向Lumentum投资20亿,既是为了分担供给链地缘风险,也向上游高价值器件进行了整合。而原模块供给商,也加快脚步在国外构造产能,应对份额压力。

从CPO今朝落地的过程来看,其推广较为保守重要来自多个方面:一是保护便利性极其成本较高,不及可插拔光模块,也会推高用户的运维成本;二是核心芯片良率偏低,导致体系整体成本居高不下;三是来自于应用处景,传统上光和铜的界线很清楚,短距离情况下,铜比光更具有优势。不过技巧的迭代将慢慢晋升良率和靠得住性,进一步优化保护便利与运维成本。同时,Scaling Law对需求的极致放大年夜,尤其是带宽的消费,使得铜与光的界线在产生改变。固然光完全替代铜还须要时日,然则偏向是明白的。

对大年夜型云厂商而言,只要能经由过程贸易手段摊薄成本、算清总账,CPO就具备范围化基本。总体而言,CPO技巧偏向已明白,剩下的只是路径问题。

——芯片家当人士姚金鑫(J叔)

——芯片家当专家张翔

OpenClaw定义「智能体计算机」,SaaS时代终局已至?

GTC 2026上,英伟达将OpenClaw定位为定义“智能体计算机”的下一代操作体系,并将其重要性类比为Linux之于办事器、Kubernetes之于云原生。为此,英伟达结合OpenClaw开创人推出企业级加强栈NemoClaw,为智能体落地供给安然、可范围化的企业级才能。

黄仁勋在演讲中抛出断定:将来绝大年夜多半SaaS都将演变为AaaS(智能体即办事)。“你的OpenClaw计谋是什么?” 或将成为科技公司的核心命题。

传统SaaS公司都将消掉的谈吐并非危言耸听,AI智能体对当前SaaS业态带来巨大年夜冲击,按席位订阅的贸易模式慢慢掉效,人力替代使得帐号需求锐减,算力成本也日益弗成控。以前SaaS企业只能向模型公司调取算力与办事,不仅情况搭建繁琐、成本弗成控,也难以支撑智能体经久稳定运行,其必须走向AI化,打造和运营自立智能体。

Token分层订价并非对传统SaaS订阅模式的替代,而是AI时代贸易模式的天然演进。客户对这一模式的接收度,也将经历从初期疑虑到慢慢认同的过程,因为Token的分层订价将实现成本与价值的精准匹配,简单查询可应用低价 Token,深度推理选择高价Token,天然适配智能体时代的算力消费逻辑。

——九章云极技巧专家陈昊

OpenClaw本质上是一个以CPU为主的控制与编排体系,外接GPU推理后端,这意味着它并非纯真的AI推理负载,而是典范的CPU密集型义务——控制路由、对象履行、状况持久化等都有CPU承担。是以,Agent越风行,AaaS生态越强大年夜,CPU的总需求就越高,且这种需求不仅表如今核数上,更表如今芯片颗数上。

与此同时,体系级才能也会成为AaaS时代的核心竞争力。将来决定Agent应用落地的,不再仅仅是模型表示,还包含可否将智能体安然、稳定地接入临盆情况,以及与之配套的云平台、对象链、连接器和安然体系,这也将推动数据中间的基本举措措施衡量标准,从纯真比拼“模型才能的强弱”转向“一致投资下可支撑的持续在线Agent数量”,即从单一的GPU算力转向GPU+CPU双芯驱动。

所以,具备CPU、GPU全栈组合才能的厂商,将在AaaS转型海潮中占据先发优势。

——芯片家当人士姚金鑫(J叔)

AI芯片还有哪些潜在的技巧趋势?算力格局将产生什么变更?迎接添加微信 YONGGANLL6662 交换商量。

(赵之齐对本文亦有供献)

注:张翔、李维、孙旭、张楠、陈昊皆为化名。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部