雷峰网("大众,"号:雷峰网)消息,2月3日,云天励飞初次对外颁布将来三年的大年夜算力AI推理芯片计谋构造,将实现百万Tokens推理成本降低100倍以上的目标。
推理算力需求暴涨,是在行业中实际产生的构造性变革。
“在推理芯片范畴,依托国内丰富的应用处景、稳定靠得住的电网和快速迭代的开源模型,我们具备弯道超车的才能,是以练习追赶、推理超车是将来5年我们的策略,而GPNPU则是AI推理芯片架构的最优解。”云天励飞董事长兼CEO表示。
GPNPU架构定义将来三年芯片路线:直指英伟达旗舰级算力产品
多个行业旌旗灯号合营指向一个趋势:推理侧竞争已不再纯真是“把模型做得更强”的参数比赛,而是“让应用跑得更久、更稳、更便宜”的效能比赛,单位推理成本与交付效力已成为范围化落地的最大年夜门槛。
推理时代的胜负手不在单点指标,而在体系级协同:既要承接主流软件生态,又要在推理负载下实现更优能效与更低时延。
云天励飞确立了GPNPU技巧路线,并提出了“GPNPU=GPGPU+NPU+3D堆叠存储”的核心公式,兼顾通用计算的“通用性”与NPU的“高效性”。

在通用生态层面,鉴于CUDA仍是全球最成熟、覆盖最广的加快计算平台之一,云天励飞的GPNPU架构致力于正视主流生态的迁徙成本问题,可以或许实现一行代码完成CUDA法度榜样兼容,极大年夜降低了进入临盆体系的门槛。
在推理能效层面,NPU可以或许实现更高的计算效力和能效比,面对大年夜模型推理这种高度构造化、可被体系化优化的负载,专用化设计带来的能效优势更轻易转化为真实成本优势,这也是国际厂商持续加码专用路线的重要原因。
同时,针对行业公认的“内存墙”瓶颈,云天励飞正深度研发 3D 堆叠存储及更前沿的互连技巧,以晋升带宽与能效,降低推理时延。
“经由过程引入3D memory架构,我们可以实现10倍于当前练习芯片HBM带宽的机能,其拜访时延将达到10纳秒级别,以实现极致的推理能效。”云天励飞CTO李爱军表示。
在架构工程与产品化路径上,云天励飞提出“算力积木”架构,经由过程Chiplet扩大与互连思路,将标准计算单位进行模块化封装与组合,让算力像搭积木一样按需扩大,形成从边沿到更大年夜范围推理的弹性产品形态。
其次是面向推理的体系级优化才能,公司拒绝纯真的“芯片参数比赛”,而是主意把“模型怎么跑得更省”沉淀到架构里,环绕真实营业负载持续迭代,逐项击穿推理链路中的成本与时延瓶颈,最终形成可复制交付的解决筹划。
“基于对大年夜模型推理的懂得,我们构造了PD分别体系架构,针对大年夜模型prefill和decode阶段不合的计算特点进行优化设计,在芯片的微架构层面上,我们同时对于Attention及FFN的计算的特点进行细粒度的分析,从而进一步的去晋升我们的推理效力。”李爱军说到。
德勤宣布的申报指出2026年推理算力将占整体AI算力的66%,推理优化芯片市场在2026年将增长至超500亿美元。字节旗下豆包大年夜模型Token应用量从2024年的单日0.12万亿,到2025年12月已冲破50万亿。

会议上,云天励飞以推动百万Token推理成本每年两位数的降低为目标,正式宣布了将来三年的大年夜算力芯片筹划。
2026至2028年,云天励飞筹划推出三代迭代芯片,节拍清楚对标国际主流厂商。
第一代超节点P芯片将于本年推出,其将面向百万长高低文的场景进行极致的prefill推理优化,在算力上紧跟H100。
2027年,云天励飞将研发第一代超节点D芯片,以此在decode推理方面实现超低延时,而其算力机能将达到B200 相当的程度。
2028年,云天励飞将研发第二代超节点D芯片,致力于实现毫秒级的推理时延,从而使得prefill和decode的机能大年夜幅晋升,在算力层面,将对标英伟达的下一代Rubin芯片。

面向AI推理需求的爆发式增长,云天励飞若何筹划下一阶段芯片研发路线图?又将若何经由过程架构立异与技巧冲破,真正实现算力效力晋升与全生命周期成本降低,从而在推理芯片范畴实现弯道超车?
手握「充分」国产产能,云天励飞打通研发、量产与范围化交付闭环

算力芯片的竞争已步入新周期,多家公司上岸本钱市场之外,还有大年夜量创业公司逐渐崭露头角。
竞争白热化的行业景况下,陈宁指出,支撑公司跨越周期的,是经久积聚建筑的贸易护城河。云天励飞的核心竞争力,已形成技巧、产能、生态、市场、本钱五大年夜维度的协同。
在此之下,产能成为落地的关键。
针对行业广泛存眷的供给链安然问题,云天励飞高等副总裁、CFO兼董秘邓浩然特别强调,公司今朝是国内屈指可数手握充分国产产能保障的企业之一,这一计谋贮备为后续芯片的大年夜范围量产与交付供给了极高切实其实定性。
此外,云天励飞受到本钱市场的高度存眷,具备足够的资金实力以支撑芯片研发的经久消费,同时在顶级芯片人才的招揽上,也可以或许走在前列。

GPNPU的架构立异,以及三年大年夜算力芯片筹划的宣布,实现了技巧与产品的闭环。
而为了应对市场竞争以及不肯定性,云天励飞更将组织调剂为更具韧性的“1+4”架构。
“1”指聚焦于AI大年夜算力推理芯片,“4”则是四大年夜事业部。作为生态构建者,四大年夜事业部旨在解决芯片从“研产临盆、优化打磨到市场推广”的核心难题。个中,政企事业部作为基石,将凭借深挚的行业经验,将计谋重点转向推理设备和智算中间的扶植,以实现营业运转的协同闭环。
据悉,云天励飞正筹划打造区域级“千卡集群”。

推理时代的竞争,本质是“单位推理成本”的竞争。只有把推理做得足够便宜、足够稳定、足够易用,AI才能从“看得见的才能”走向“用得起的临盆力”。
将来,云天励飞将以GPNPU架构为核心,大年夜力推动云端大年夜算力强化软硬协同与存储体系攻坚,实现百万Tokens推理成本降低超100倍的目标。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。

发表评论 取消回复