不少业内人士也表示:同一协定带来高效互联的情境下,异构集群效力会更高。大年夜模型推理等义务构造复杂,不合模块天然适配不合芯片,强行同构反而会抹销场景化适配带来的机能收益。

从当前家当实践来看,全球已形成多条技巧路线并行竞争的格局:英伟达NVLink凭借成熟生态与全栈封闭体系占据高端练习主导地位;华为灵衢依托超节点架构在国内智算中间实现范围化安排;UALink联盟以开放标准为基本,打造多厂商兼容的开放互联协定,形成“反英伟达”联盟;ETH‑X、SUE等以太网开放协定,以及OISA标准,在通用物理层之上构建原生超节点互联协定,兼顾开放生态与安排成本。

路线的差别客不雅上构成了彼此割裂的生态孤岛,设备互操作性受限,客户一旦选定某条路线便深陷迁徙成本昂扬的“单选题”困境。

“英伟达新一代DGX SuperPOD同一内存域的范围上限为576个Rubin GPU,核心原因恰是其多层异构的互联架构:GPU与CPU之间采取NVLink或PCIe、GPU与GPU之间采取NVLink,而跨办事器互联则采取InfiniBand或以太网。”资深家当专家刘雨嫣表示,“不合层次的计算资本采取不合协定互联,会直接推高集群保护成本,同时减弱收集弹性。”

不过这一困境并未动摇国内厂商自研的路径,不少厂商接踵推出采取自研互联协定的超节点筹划。

“但这类企业广泛缺乏chip-to-chip片间互联技巧的积聚,而算力体系向scale-up深度演进的过程中,对收集才能与体系架构的请求却会持续抬升。收集研发的技巧难度并不亚于高端芯片设计,且至少须要500人的团队范围才能支撑。”芯片厂商高管张翔评价道。关于国产芯片厂商在超节点范畴的竞争态势,迎接添加微信 YONGGANLL6662 交换更多信息。

汗青规律反复验证:协定标准化是技巧范围化爆发的先决前提。TCP/IP奠定了万维网,4G LTE收敛催生了移动互联网。超节点互联亦然,只有经由过程开放同一的互联协定,实现算力硬件的全域互通与高效协同,才能真正支撑起下一代AI算力基本举措措施。

那么,既然开放是大年夜势所趋,为何头部厂商仍保持以封闭协定建筑壁垒?在标准割据与生态垄断的夹缝中,中小芯片厂商是否还有破局空间?这场关乎将来算力格局的技巧博弈,最终是否真的会像互联网一样,走向协定同一与全域互通?

“互联标准不同一、生态割裂,是当前的必定成果。谷歌和英伟达在设计超节点互联架构之初,就没有以开放兼容为目标。它们不会等待行业形成共鸣,而是持续迭代新标准,以此保持技巧领先身位。” 通信芯片专家李南指出。

多位行业人士也认为,超节点整体仍处于极早期阶段。它的出现,本质源于云计算架构从通算向智算转型,这一变更请求云计算体系必须环绕AI范式进行周全重构。

“在当下周全重构的阶段,互联协定是冲破超节点‘通信墙’这一核心瓶颈的关键地点,是以各大年夜巨擘正经由过程封闭化的技巧路线,快速建筑属于本身的底层壁垒,所以这个阶段寻求协定同一并不实际。”刘雨嫣说。

谷歌为TPU集群量身打造了封闭式芯片间高速互联协定 ICI(Inter-Chip Interconnect),并将其与OCS光电路交换、以太网交换机、专用光模块以及TPU深度协同,实现了极高的产品解决计整洁致性,根据需求构建了“苹果式生态”。“这种情况下他们必定是实现后果最佳的,Gemini 3的成功就是最有力的解释。”李南评价道。

“但英伟达须要兼顾原有技巧体系的兼容性与持续性,短期内其超节点范围仅能支撑到576颗芯片。而云厂商身处激烈的MaaS竞争,供给Token办事必须原生支撑超大年夜范围集群调剂,面向的是百万卡级其余组网才能,这种路线差别最终带来了两边产品形态的分化。”芯片专家子皓表示。

不过,业内广泛认为,二者只是技巧优先级与演进路径不合,本质差别并不大年夜。英伟达后续同样具备支撑百万卡级范围的才能,这就意味着英伟达和谷歌一样,都将具备强大年夜的范围化安排才能。

所以,为了充分应用封闭自研协定的优势,英伟达及谷歌都定义同一、标准化的原子节点。经由过程让每一个最小算力单位形态、接口、机能保持一致,实现大年夜范围的高效组网。

子皓向雷峰网表示:“AI云是赢家通吃的市场,一旦错掉先机,很可能彻底被边沿化。而封闭的互联协定,恰是当前英伟达和谷歌重要的竞争手段,甚至可以说是最优选择。”

英伟达则从底层硬件出发,自下而上构建超节点解决筹划。其以NVLink为核心的私有互联技巧,供给了远超传统以太网的带宽与通信效力,让多芯片以极低时延实现高效协同调剂,并且靠着在单芯片设计才能上的垄断地位,其在市场上同样极具声量。

那么,面对英伟达和谷歌强大年夜的竞争壁垒,超节点这场游戏是否还有新玩家的席位?

各家单打独斗,本质是出于抢占生态话语权、构建技巧壁垒等考量,但这一做法无疑加剧了协定生态的碎片化。行业更主流的共鸣,指向了另一条更关键的路径:协定标准化。

国产超节点陷阱:500人团队逝世磕自研协定,不如接入开放生态

“对绝大年夜多半芯片厂商而言,超节点赛道已明显超出其才能界线。这类企业广泛缺乏chip-to-chip互联技巧的积聚,而算力体系向scale-up深度演进的过程中,对收集才能与体系架构的请求却会持续抬升。”张翔表示,“收集研发的技巧难度并不亚于高端芯片设计,且至少须要500人的团队范围才能支撑。”

与此同时,对于纯真聚焦超节点体系解决筹划的厂商而言,同样面对难以破解的行业困境:超节点的技巧话语权与生态落地,高度依附行业巨擘带头并定义标准,自力筹划商很难凭借自身力量建立事实标准,但被动跟随、适配巨擘标准,又会在家当链中掉去弗成替代性。

在标准话语权缺掉、自研投入性价比较低的多重束缚下,对不少厂商而言,过度寻求互联协定自立权,反而轻易变成不切实际的“内耗”,并进一步加剧互联协定生态的割裂。而放弃协定自研,是否就等于放弃生态话语权?迎接添加微信 YONGGANLL6662 交换这一行业抵触。

芯片公司和OEM的合作是一个破局的思路,寒武纪与中兴通信的合作供给了一个“分工解耦”的例子,前者专注MLU-Link芯片级互联,后者发挥体系级工程化优势,两边经由过程协定适配完成超节点落地。华为开放灵衢2.0协定,为第三方芯片厂商供给高速互联才能,支撑超节点集群的多卡扩大。中国移动OISA等开放联盟同样破解标准割裂,走“国芯国连、协定共用”的开放路线。

此外,在超节点的产品形态下,采取同一开放的互联协定正为中小芯片厂商对抗谷歌、英伟达的封闭生态供给了汗青性契机。

趋境科技架构师谢威宇向雷峰网("大众,"号:雷峰网)表示:“国产算力硬件厂商当下不该走封闭路线,在英伟达和谷歌的体系中,异构会带来效力损耗,但对中小厂商而言,超节点则供给了异构的契机,其通信与计算并非强耦合,所以同一的通信层为家当协同创造了前提。英伟达之外芯片厂商间的合作,能在全球竞争中占据更大年夜的市场份额。”

“当前,PD分别已是成熟且易于落地的拆分筹划。将来还可向更细粒度延长,例如在模型内部实现Attention与MoE、稠密计算与稀少计算的分别,让更匹配的计算硬件承接更细分的义务,会有更高效力。”谢威宇表示。

行业共鸣也并非只有“兼容开放”一条路径:拥抱开放协定是务实选择,而为适配自身优势场景,走向适度的协定自立化,同样是国产算力厂商值得摸索的可行偏向。

这种场景化自立,建立在对超节点最优范围的断定之上。对部分芯片厂商而言,其真正的优势区间也较为明白:面向中小型模型推理集中在16–64 卡,万亿参数大年夜模型则在128–256卡。

“过度寻求超节点范围,一旦超出阈值,通信延迟增长会抵消算力晋升,导致GPU闲置率上升、故障率急剧攀升,MFU也会大年夜幅降低。聚焦优势场景与成本优化,经由过程低精度算力与互联协定深度优化,才能有效降低单Token成本,远比盲目扩集群范围更具竞争力。”曦望Sunrise联席CEO王勇表示。

NVLink终将「安卓化」?CSP对封闭协定没有“容忍度”

范围化安排可以或许带来极强的“排他性”,进一步强化了英伟达及谷歌的垄断地位。

超节点互联协定生态的“开放”与“封闭”之争,是AI基本举措措施家当极具张力的叙事主线。这场博弈不仅关乎技巧路线的胜负,更将决定下一代算力基本举措措施的权力分派格局。

“当超节点演进为全行业的技巧核心,其范围效应与机能需求将自下而上驱动当前碎片化的收集互联协定生态向收敛态演进。这一过程有望推动资本与研发力量向同一的开放协定体系汇聚,最终构建出支撑下一代数字基本举措措施成长的、具有广泛互操作性的标准协定框架与生态体系。”田陌晨表示。

SUE、OISA、ETH-X、UALink等协定的出现,正慢慢推动开放互连生态的构建。

“超节点互联协定生态的碎片化,正成为制约其范围化安排的核心瓶颈。”奇怪摩尔CEO田陌晨说。

然而,这一收敛过程注定不会一蹴而就。

超节点互联协定碎片化是一个复杂命题,仅笔据一企业的力量难以进行兼顾,这是一场关乎“生态构建”与“家当协同”的体系性工程,其成功高度依附于家当链高低游的慎密协作。

是以,市场力量也将成为打破封闭格局的关键推力。

“CSP(云办事供给商)企业与大年夜客户对封闭协定的容忍度会逐渐切近亲近临界点,其推动协定开放的诉求日益强烈。英伟达固然经由过程NVLink和InfiniBand能构建起技巧壁垒,但面对这种行业压力,开放协定是迟早的工作。”刘雨嫣表示。

事实上,英伟达已于2025年5月推出NVLink Fusion,将封闭的NVLink高速互联技巧开放为可集成第三方芯片的半定制架构,但重要面向云厂商等客户及合作伙伴,且有严格准入与合规门槛。

总体看来,封闭与开放的博弈本质上是家当成长阶段的映射。

谷歌ICI、英伟达NVLink等垂直整合筹划,皆是特定汗青阶段的产品:先以封闭体系快速知足市场需求、初步确立工业标准,再经由过程行业协会渐进式推动协定同一,最终交由UEC等家当组织落地实现,这一路径在IT家当成长史上习认为常。

互联网的成长过程为此供给了最有力的参照。

无论是WLAN、以太网、5G等不合底层接入方法,照样手机、电脑等各类终端,彼此之间的通信都同一基于IP协定承载。恰是凭借这套全球通用的协定体系,互联网才打破了早期各类私有通信协定的壁垒,实现全域互通。

封闭协定催生生态「排他性」,谷歌与英伟达会就此「赢家通吃」吗?

这一逻辑同样实用于当前的AI算力基本举措措施。

采取开放同一的超节点互联协定,可以或许让算力硬件全域互通、高效协同,以此支撑起爆发式增长的算力需求。

循此逻辑,面向国产超节点互联的将来成长,更可行的路径已然清楚:由国内大年夜型云办事商与头部厂商协同,在工信部指导下,合营制订同一的中国国度标准。回想以前几十年的技巧演进,PON接入、TD-LTE等重大年夜技巧体系均走过类似门路,以顶层引导与家当协同的方法,形成自立可控、范围化落地的技巧标准体系。

作者经久存眷AI芯片、存储范畴,迎接添加微信 YONGGANLL6662 交换更多行业信息。

注:文中张翔、李南、子皓皆为化名。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部