
他表示,英伟达拥有“稳健的供给链”,可以或许应对需求压力,这在很大年夜程度上得益于该公司将很多CPU与GPU一路在机架级体系中发卖。
哈里斯解释说:“假如你是超大年夜范围云计算企业,你会欲望最大年夜化每个CPU的核心数量,这本质上是为了降低成本,即每核心成本。所以这是一种贸易模式。”
英伟达最新Vera CPU
如今,英伟达预备在周一揭幕的年度GTC大年夜会上,颁布其针对AI智能体优化的CPU的新细节,届时很可能在展台上推出一款纯CPU机架。
英伟达在2021年宣布了其首款数据中间CPU Grace,下一代产品Vera现已投入临盆。这些CPU平日与英伟达有名的Hopper、Blackwell或Rubin GPU一路安排在完全的机架级体系中。
GPU需求的激增使英伟杀青为家喻户晓的企业,并成为全球市值最高的上市公司,市值达到4.4万亿美元。本年2月,英伟达整体芯片计谋产生了重大年夜改变。当时,英伟达与Meta杀青了一项多年协定,个中包含初次大年夜范围自力安排Grace CPU,并筹划在2027年安排Vera。
英伟达告诉CNBC,数千个自力的英伟达CPU也在为得克萨斯高等计算中间和洛斯阿拉莫斯国度实验室的超等计算机供给动力。
智能体带动CPU中兴
“以前六到九个月,需求出现了前所未有的增长。”AMD数据中间主管福雷斯特·诺罗德(Forrest Norrod)在接收CNBC采访时表示。
美国银行猜测,CPU市场范围可能会增长一倍以上,从2025年的270亿美元增至2030年的600亿美元。仅在上个季度,英伟达就创造了跨越620亿美元的数据中间收入,同比增长75%。
“CPU正成为扩大AI和智能体工作流的瓶颈。”英伟达AI基本举措措施主管迪昂·哈里斯(Dion Harris)本周对CNBC表示。他认为,这是一个“令人高兴的机会”。
CPU的中兴源于计算需求的根本变更:跟着AI大年夜范围普及,应用处景从问答型聊天机械人逐渐转向以义务为导向的智能体应用。
固然GPU异常合适练习和运行AI模型,因为它们拥有成千上万颗专注于同时履行大年夜量运算的小核心,但CPU拥稀有量较少的高机能核心,可以运行持续的通用义务。
AI智能体须要大年夜量通用计算才能,因为它们须要在AI工作流中传输和处理大年夜量数据,并在多个智能体之间进行协同和调剂。

黄仁勋
英伟达CEO黄仁勋(Jensen Huang)在上个月的财报德律风会议上表示:“这些智能系一切正在衍生出不合的智能体,它们像一个团队一样协同工作。tokens生成的数量已经出现指数级增长,是以我们须要以更高的速度进行推理。”
黄仁勋在德律风会议上多次提到AI智能体,并表示:“在硬件需求改变的情况下,最重要的就是每瓦机能。”

英伟达在一份消息稿中表示,其自力CPU在Meta的数据中间明显晋升了每瓦机能。Creative Strategies芯片分析师本·巴亚林(Ben Bajarin)表示:“这是全新的基本举措措施:纯CPU机架的全新扩容只负责运行AI智能体。你的软件将位于别处,你的加快器只负责处理tokens,但必须有中心层来负责调和调剂。”
CPU供给危机
如今,一度沉寂的CPU市场正面对咨询公司The Futurum Group所称的“静静静的供给危机”。该机构猜测,到2028年,CPU市场的增长率可能会跨越GPU。
据路透社报道,头部CPU供给商AMD和英特尔已向中国客户发出供给缺乏警告。报道称,CPU交付周期长达六个月,价格已上涨跨越10%。
诺罗德认为,CPU需求在短期内不会放缓,也不会停止增长,但AMD已经预感到了需求的增长,并正在“加紧尽力”以知足需求。
英特尔谈话人告诉CNBC,该公司估计本季度库存将达到“最低点”,“但我们正在积极应对,并估计从第二季度到2026年事尾,供给将慢慢改良”。
Creative Strategies芯片分析师巴亚林表示:“晶圆不会本身长出来。我们没法凭空多收成10%的硅晶圆。全部行业都面对供给重要的局面。所以不幸的是,CPU晶圆供给受到了限制。”
当被问及英伟达是否会遭受CPU发货延迟时,英伟达AI基本举措措施主管哈里斯告诉CNBC,“今朝一切正常”。
为GPU优化
哈里斯表示,与英特尔和AMD临盆的更为通用型CPU比拟,英伟达在设计上采取了根本不合的办法,使其CPU“最合适”数据处理和AI智能体工作流程。
个中一个重要差别在于每个CPU的核心数量。AMD的EPYC系列和英特尔至强高机能办事器CPU平日拥有128个核心,而英伟达Grace CPU拥有72个核心。
AMD EPYC系列办事器CPU
然则,英伟达设计其CPU的初志是专门帮助其明星产品GPU运行AI工作负载。“在这种情况下,你的单线程机能比每核心成本更为重要,因为你要确保那个极为昂贵的资本GPU不会余暇等待。”哈里斯说。
英伟达的CPU也基于ARM架构,该架构更常用于智妙手机等低功耗设备的芯片,而英特尔和AMD的CPU则基于传统的x86架构。x86由英特尔在近50年前推出,自出生以来一向主导PC和办事器处理器设计。
AMD数据中间主管诺罗德表示:“我认为,英伟达已经异常好地优化了他们的芯片,用于为GPU供给算力支撑,但它们并没有针对通用应用进行很好的优化。”
实际上,英伟达在某些产品上确切依附于更通用的CPU。例如,在HGX Rubin NVL8平台中,英伟达将自家GPU与英特尔或AMD的主机CPU配对,供客户用作构建自有AI机架的基本组件。
英伟达进军自力CPU市场之际,其越来越多的客户正在为自家数据中间研发基于ARM架构的处理器。
亚马逊是首家推出自研CPU的重要超大年夜范围云办事公司,于2018年宣布了Graviton处理器。The Futurum Group称,Google在2024年宣布的Axion处理器,如今处理着约30%的内部应用。微软在客岁11月宣布了其第二代Cobalt处理器。ARM估计将于本年推出其自研CPU,Meta将成为其早期客户。
研究公司Mercury Research估计,2025年第四时度,办事器CPU市场份额由英特尔主导,占比60%,AMD占24.3%,英伟达占6.2%,其余份额则由亚马逊、微软和Google等超大年夜范围云计算企业基于ARM架构的自研CPU占据。

发表评论 取消回复