“在当前的AI比赛中,不论是多模态照样基模厂商,一旦选定深耕赛道,其必定会走的门路就是设计极致适配自身营业的芯片底座。”芯片专家方志讲到。
站在通用芯片厂商的视角,GPU的设计初志,是为适配多元营业场景。周全兼容的价值,是大年夜量冗余的逻辑单位与高度复杂的通用硬件架构。
为“泛用性”做出的架构弃取,使得通用化设计面对天然让步:计算阵列无法为特定AI义务做深度定制与极致调优,多芯片组网存在明显的互联通信开销,每一项都直接影响整体效力。
对于效力的“不知足”,让云厂商开端自研芯片,摆脱英伟达的统治。
凭借场景与研发的闭环优势,云厂商经由过程真实营业负载与模型运行数据,反向定义芯片设计,将AI高频算子与核心计算逻辑直接固化为硬件电路,用硬件履行代替高等说话代码,从根源上砍掉落冗余开销,实现效力最大年夜化。
TPU和Gemini是海外实践样版,PPU和Qwen则是国产标杆筹划。1月29日,平头哥半导体颁布PPU真身,“真武810E”高端AI芯片正式表态。
跟着真武810E正式表态,阿里全栈自研的双重闭环浮出水面。平头哥实现了芯片从计算到存储的覆盖:从镇岳510 SSD、倚天710 CPU到真武810E,底层算力芯片周全自研;而平头哥、阿里云、通义实验室的慎密耦合,形成“通云哥”黄金三角,抢占行业领先身位。
雷峰网懂得到,平头哥早在2020年便机密启动了“真武810E”的研发,并于2022岁尾、2023岁首年代,完成了研发和场景验证,在此时代,其研发和验证几乎始终处在“只对内部开放”的状况。
这是基于行业顶层视角的计谋研判。互联网赛道外,车企已成为云营业需求最旺盛的核心群体,绝大年夜多半车企选择“上云”而非“建云”。
但双重闭环只是起点,协同质变才是核心。
芯片、云平台与模型若何产生“1+1+1>3”的协同效应?从底层硬件到上层应用的全栈自研体系,又将若何重构阿里的本钱市场估值逻辑?
真武810E,懂AI云的芯片
“芯片厂商的营业,云厂商都有才能覆盖;而云厂商却可以或许依托自身海量营业场景,率先发明体系痛点并给出解决筹划,是以在架构立异上,头部云厂商将始终走在行业前列。”云行业专家张峰分析到。
当下,MaaS 已然成为云厂商比赛的核心疆场,采取 “From cloud to chip”(从云到芯) 思路搭建自研算力基座,成为行业主流选择。云厂商从自身营业场景出发定义芯片,让最终解决筹划生成具备大年夜范围组网、集群调剂、云上原生适配的先天优势。
真武810E的大年夜内存以及高速互联,都展示了阿里自研芯片的优势,其配备的96GB HBM2e高带宽内存,可承载千亿参数大年夜模型训推与长序列义务,3D堆叠设计更让功耗、散热表示优胜,实现高频稳定运行。
700GB/s片间互联基于自研ICN链路与7个自力ICN端口,集群加快比高、多卡扩大灵活,带宽超出A800,合营平头哥自研互联加快库,实现多卡协同工作,从而高效支撑模型训推需求。
多卡互联作为大年夜模型时代高机能芯片的刚需,真武810E的PCIe 5.0×16接口带来单向63GB/s、双向128GB/s带宽,是PCIe 4.0的2倍,可以或许完美适配大年夜模型海量数据吞吐,降低主卡间数据传输瓶颈。
功耗也日益成为高机能芯片绕不过的难题,真武810E的400W低功耗可实现更密集机柜安排,进步能效比,降低了数据中间运营成本与PUE,并经由过程冷板式液冷实现稳定控温。
从核心参数来看,真武810E的综合机能达到国际领先程度。据媒体报道,真武 PPU 累计出货量已达数十万片,跨越寒武纪,在国产 GPU 厂商中属于第一梯队。
在阿里全景架构下,则实现了“平头哥+阿里云+千问模型”黄金三角的闭环。
底层算力层面,平头哥在包管自研芯片高兼容性、广场景覆盖需求的前提下,团队可慎密贴合阿里云智算集群的收集拓扑、虚拟化架构与调剂策略,开展芯片架构、IO通路、功耗控制等层面的定制化协同优化。
这种领先优势,是“From cloud to chip” 路线的直接表现。依托芯片与营业场景的协同设计,真武810E从架构层面就与阿里生态深度绑定,规避了芯片与云平台跨架构适配带来的指令翻译额外机能损耗,让算力在最低损耗下释放,成为“最懂”AI云的芯片。
雷峰网懂得到,当前推理算力需求已占据AI应用企业70%的成本权重,在推理需求爆发的场景之下,算力好用的另一个重要表现是具备足够的性价比。
完美的编译器与算子优化才能,支撑从底层硬件到上层大年夜模型的全链路调优。开辟者可针对实际营业场景,实现精细化算子适配与调剂优化,进一步放大年夜算力的效力优势。
综合以上强大年夜机能,真武810E此次表态,阿里“芯片、云平台、模型”AI全栈自研生态的最新疆土涌如今所有人面前。这套闭环体系所建筑的技巧壁垒与贸易价值,也让阿里在全球 AI 算力竞争中的生态位优势愈发清楚。
“阿里正用极其清楚的计谋筹划,让具备强耦合特点的架构闭环集中爆发,飞轮效应正式奏效。”一位行业人士点评道。
真武810E的公开,让平头哥“存储-计算”芯片闭环与阿里全栈AI生态闭环正式浮现。
平头哥,构建了“镇岳510 SSD主控芯片+倚天710 CPU+真武810E”的协同闭环,打造了机能领先的国产自研算力体系。
全栈自研筹划的重要价值在于实现供给链安然自立。以缓存场景为例,跟着Intel傲腾(Optane)慢慢停产,市排场临核心缓存介质供给断档的难题。而依托平头哥自研芯片组合,搭配PSLC NAND闪存,可实现傲腾产品的国产化平替,用通用NAND闪存替代专属新型存储介质,应对供给风险与安然隐患。
营业架构「双闭环」,“co-design”让阿里占据领先身位
另一项红利,是硬件深度协同优势。
自研CPU可根据营业需求,灵活选用RISC‑V、ARMv9等合适指令集,甚至采取自立架构;GPU、SSD主控的通信协定、数据通路与缓存策略,均可与CPU进行同一设计与深度适配。一方面可以或许缩短CPU与GPU间的PCIe传输延迟,优化异构算力调剂效力,另一方面可让SSD主控逻辑直接匹配CPU内存控制器与IO调剂策略,降低读写放大年夜,明显晋升4K随机读写机能。
“以DeepSeek推出大年夜型MoE模型为例,其本质就是在云端集群场景下实现了极致的模型与硬件的co-design,以此最大年夜化释放算力机能,而阿里的全栈自研将是更‘激进’的原生适配筹划。”推理框架优化专家张涛解析到。
黄金三角闭环直接带来的是阿里原生的紧耦合协同架构,这与以前一段时光英伟达+甲骨文+OpenAI的组合引领生AI成长的方法不合,跨企业的协同会带来效力的损掉,阿里则是和比来激发广泛存眷的谷歌一样,在企业内部实现了三个环节的深度耦合。
雷峰网懂得到,真武810E已经在阿里云实现多个万卡集群安排,这意味着阿里云为平头哥系列芯片产品的范围化安排供给了领先一步的验证平台,能更高效地指导芯片产品的迭代与协同。
对通义大年夜模型团队而言,在自研芯片与阿里云的双重加持下,千问模型的训推效力实现了阶梯式晋升,能为企业客户供给更稳定、更高效、更低TCO的云端推理办事。
个中,真武810E芯片针对Qwen3等主流MoE架构模型,完成了算子深度优化、张量并行调剂、显存智能调剂等专项适配,可高效支撑千亿甚至万亿参数大年夜模型的分布式练习与高并发推理,充分知足千问系列在大年夜范围计算场景下的机能需求。
对阿里云而言,在全球AI算力持续紧缺、算力成本高企、供给不稳定的行业背景下,自研芯片从供给侧实现核心硬件自立可控,并降低了算力基本举措措施的扶植成本,还能为企业客户供给更差别化的算力和模型办事选择,进一步晋升阿里云的市场竞争力。
据悉,平头哥PPU芯片总出货量达数十万片,跨越寒武纪,千问在中国企业级大年夜模型调用市场中位居第一、阿里云季度营收达398.24亿元,同比增长34%。
全景视角下,阿里已具备对标“英伟达+甲骨文+OpenAI”组合的生态化才能,在全球AI竞争中处于领先身位,这也重构了阿里的估值逻辑。
“通云哥”浮出水面,「AI工厂」重构阿里估值逻辑
经久以来,本钱市场对阿里的认知,一向被“电商平台”、“互联网巨擘”等标签所固化。这种单一化的刻板印象,简化了对其价值的分析框架,也轻易因忽视公司内部正在产生的深度营业变革,造成投资断定上的误差。
一个不容忽视的事实是:当行业内多半企业还在摸索AI构造路径时,阿里已凭借一系列前瞻性决定计划与精准卡位,完成全栈AI才能的构建,跻身全球顶级科技企业行列。
在全球科技巨擘的共鸣中,成为“AI工厂”就意味着控制AI时代的“水电煤”。但假想与实际,存在巨大年夜的落地鸿沟,阿里生态的闭环,绝非一日之功。
2018年,当绝大年夜多半企业还沉浸在互联网营业红利时,阿里便已开启了其面向AI的计谋构造:昔时4月,阿里出手全资收购中天微;9月,整合中天微与达摩院芯片团队,平头哥半导体应运而生,营业构造前瞻性周全领先于当前备受存眷的国产GPU四小龙。
大年夜范围的芯片研发投入之下,阿里云不是只顾短期收益,投入大年夜量资金研发HPN 7.0智算集群收集架构,成为SIGCOMM汗青上首个AI智算集群收集架构成果,支撑通义千问2.5版本中文机能成为世界顶尖模型。
2019 年,通义实验室正式启动大年夜模型研发,阿里AI生态的“软件攻坚”帷幕正式拉开。2021年,全球首个十万亿级参数大年夜模型M6成功落地,如今,通义实验室宣布的千问大年夜模型家族,已然跻身全球第一梯队开源模型。
技巧的深度,并非困在“自嗨式”的研发闭环里。
资深芯片专家徐东向雷峰网讲述真武810E时,罕有地应用“好用”二字对一款国产芯片进行评价。
雷峰网懂得到,真武810E重点拓展大年夜型车企及金融行业。
另一方面,车企对于AI练习的机能请求根本介于L20与H20之间的算力程度,而真武810E正好精准匹配这一市场痛点,成为车企算力采购中的优选筹划。
金融场景作为数据密集型行业,对算力的核心诉求在于“安然可控、低时延、高稳定”,同样是国产芯片厂商打造“标杆案例”的优选范畴。
雷峰网("大众,"号:雷峰网)获悉,广西某银行项目宣布了数十台算力办事器的招标需求,基于产品机能及营业适配性,对投标的国产芯片厂商进行测试,多家头部国产芯片厂商投标,最终真武810E脱颖而出。
真武810E经由过程搭载超大年夜带宽、高容量HBM2e内存,打破内存墙的限制,解决大年夜模型推理场景下的内存瓶颈与带宽压力,让大年夜范围、高性价比的贸易化推理营业过程加快。
“这个案例没有任何水分,真武810E确切有很强的竞争力。”一位全程介入项目实施的业内人士直言。
依托完全的AI全栈技巧体系,阿里相干解决筹划已在多个行业实现范围化落地验证:办事小鹏汽车、国度电网、中科院、新浪微博等400余家行业标杆客户。
从底层芯片研发到顶层场景应用,阿里始终保持经久主义,锚定技巧可行、贸易可用的核心偏向做出关键决定计划。凭借硬核技巧对标才能与范围化落地成效,其技巧疆土与贸易价值已形成清楚佐证。
“重估阿里”不是标语,而是对其技巧价值的“理性回归”。
注:文中方志、张峰、张涛、徐东皆为化名。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。

发表评论 取消回复