是以,算力的“普惠化”行动势在必行。
作者 | 赵之齐 刘伊伦
编辑 | 包永刚
自DeepSeek在客岁春节出圈以来,春节已然成了AI行业的“狂欢季”。
各大年夜晚会连番登台的机械人、科技从业者们在代码堆里守岁,本身就是一种隐喻:AI正逐渐长成社会运转中不克不及停下的“基本举措措施”。
站在马年的新起点,雷峰网对话了算力家当链上八家标杆企业的CEO,商量AI给算力家当带来的各种逻辑重塑。
有趣的是,如今,行业对待AI的方法正在经历一场集体“降维”:当技巧红利阶段性触达天花板,真正决定行业逝世活的命题变得加倍具体且真实——
电力缺口、存储产能瓶颈、算力应用率与成本、硬件连接与算法协同,甚至AI给组织架构带来的深层颠覆等等……(算力链面对挑衅的更多细节,迎接添加作者微信 Ericazhao23 交换)
作为这场变革的亲历者,CEO们亲述的八个片段互为印证,合营拼凑出算力家当当下最核心、真实的命题。
一、需求狂飙,基建托底
当算力需求越来越大年夜,IDC基建作为基本,会见临什么新的挑衅?
秦淮数据 CEO 吴华鹏:GW级智算不是盖「完美大年夜楼」,而是搭「可拆装积木」
我是一个有着强烈技巧崇奉的人。
亲历互联网和移动互联网如火如荼的30年,在当前,我强烈感触感染到数据中间行业正站在由AI重构家当格局的新起点上。
以前一年,GW(吉瓦,10亿瓦特)级智算园区这一“新物种”,已成为行业成长的重要偏向,但超大年夜范围算力若何与电力体系适配、协同,依然挑衅重重。
这一瓶颈的核心在于:算力需乞降扶植范围在爆发式增长,但新能源体系的支撑才能,尚未完全匹配成长需求。
具体来看,抵触重要集中在三个层面:
一方面,GW级园区一年的耗电量堪比一座中等城市,传统分步拓建的电力基建模式,面对“整体筹划预留、分阶段范围化交付”的扶植需求,已经很难知足。
三、软硬件新疆场
其二,GW级园区请求高比例绿电,但高比例新能源接入后,在负荷波动、热源治理、智能控制等方面,都还没有足够成熟的筹划应对。
而在如斯宏大年夜的用电基数下,效力每晋升一个百分点,都意味着巨大年夜的贸易价值——这也让效力优化拥有了前所未有的紧急性。
而外部的技巧供给和市场竞争,仍在给行业带来不肯定性。
GPU 产能、进口相干身分,会直接影响算力安排节拍。同时,头部企业扎堆涌入乌兰察布、中卫这类核心节点,让优质电力、地盘资本的争夺越来越激烈,企业拿资本的难度明显加大年夜。
整体看下来,行业竞争的核心,已经从“拼范围”,转向“范围”与“质量”并重。相对完美的能源解决筹划,是当下数据中间企业冲破瓶颈的关键一环。
而一个愈发清楚的趋势是:越是传统的组件,越轻易成为新的瓶颈。
在这方面,我们经由过程与东阳光集团的计谋整合,已经取得本质性进展。客岁9月,东阳光牵头的银团以280亿元现金收购秦淮数据中国区全部营业,本年1月完成股权交割。
以前几个月,我们已在韶关、乌兰察布、宜昌签约重点项目,“东数西算”十大年夜集群,秦淮已落子过半。今朝,我们投运及在建IT容量近1GW,贮备与筹划容量达到4GW。接下来还将在乌兰察布,和东阳光联手打造国内首个GW级超大年夜范围绿电直供垂直一体化家当示范区。
此外,我们还结合东阳光以及家当链伙伴,推出全球首个基于SST(固态变压器)的算力中间智能直流供电贸易化筹划,将于本年4月在张家口怀来正式投运。
这个筹划能让电力转换效力达到98.5%,是业内最高程度;单功率柜输出功率达1MW,占地面积仅1㎡,相较传兼顾划削减50%以上。与此同时,面对AI GPU负载的激烈波动,这个体系还能主动调节供电策略,及时智能应对。
这些营业进展,为我们扶植GW级园区奠定了坚实基本。但我也深知,打造GW级AI算力中间,不是盖一栋一步到位、极致完美的楼,而是搭一套“可拆装的积木”——
面对算力、电力、技巧的多重不肯定性,解决办法是采取模块化、分期扶植和才能解耦,杀青弹性交付。
AI革命将掀起一场持续20年的技巧海潮,在这之中,焦炙和压力都在所不免,逝世守初心就更为关键。结合我的体悟,我也想与治理者们共勉:
如今,硬件问题也不克不及仅靠硬件解决,假如无法在指令集与精度层面实现芯片与大年夜模型的深度协同,算力天花板依然近在咫尺。
保持做行业中的“良币”,锚定底层逻辑、持续立异、走经久主义,才能在这场AI革命里立得住、走得远。
2025年事首年代,DeepSeek R1的宣布引起巨大年夜反响,Sparse MoE(稀少混淆专家模型)敏捷成为主流。以前一年里,模型才能持续跃升、迭代速度明显加快,各类应用也随之快速普及。
UCloud CEO 季昕华:AI迭代进入「月更」时代,云厂商面对跨学科的认知重塑

当下,AI技巧迭代速度极快,几乎每隔一个月就会出现一次行业级冲破,行业模型与应用的市场热度呈指数级增长,这些都请求我们云厂商具备高频、高强度持续进修的才能,深刻懂得跨学科、跨行业的家当链条,在懂得AI技巧本质的基本上,推动营业联动与生态合作,才能实现贸易价值的最大年夜化。
我和团队不雅察下来,今朝限制行业冲破的核心瓶颈,在于对AI的认知程度:
对AI技巧成长的认知,决定我们跟进的速度;对AI应用后果的认知,决定我们应用的广度;对AI贸易成长的认知,决定我们投入的力度;对AI影响才能的认知,决定我们成长的高度。
客岁,我们负责了一项海外千卡智算中间项目,这本身就是一个复杂度极高的综合性工程。
而在海外落地,难度还要再上一个量级。
我们面对的是多样化的国度政策与市场情况,前期要投入大年夜量精力调研和实地考察;到交付阶段,还会碰到很多弗成控身分——国际政治形势、本地司法律例、极端气象、海关流程等,都可能成为棘手的挑衅,导致项目延期。
好在,团队顶住了压力,稳步推动着项目。当客户最终完成压力测试,体系安稳上线运行的那一刻,我们持续数月紧绷的神经终于得以放松。
在海外拓展构造的过程中,客户一向很懂得、支撑我们。很多新节点资本一上线,就敏捷被客户采购一空。我们对此深怀感激,并对将来的合作与市场前景保持乐不雅。
但与此同时,业界也广泛感触感染到:因为内存、存储、CPU等核心硬件产能不足,供给链正出现明显波动。这可能激发各行业在传统IT支出上出现构造性调剂,后续走势仍需持续不雅察。
并且,每次具有冲破性的新模型宣布,都可能重塑竞争格局,使得资本有限的中小企业面对更大年夜压力。正如昔时GPT系列的出现,导致大年夜量传统NLP公司被洗牌出局,持续的迭代海潮可能令类似的汗青再次上演。
做难而精确的事,有如推石上山。我们清醒地知晓其重量与反复,而真正的选择在于:手不松,步不止。价值,就在这持续的攀登之中。
在2026年,我们将果断AI和全球化两大年夜计谋。
AI层面,我们将环绕六大年夜偏向持续深刻:基本模型、行业模型、AI应用、AI+硬件、机械人和无人驾驶,以及Agent拓展。例如,AI立异应用层面,我们将持续以UModelVerse模型办事平台为载体,经由过程token计费方法,让始创企业在AI成本支出更为可控;同时,我们推出的Agent Sandbox可以降低AI Agent的临盆应用门槛,为AI真正自立处理高复杂度、高风险义务供给基本举措措施级保障。
全球化层面,我们将加快完美全球云计算办事收集,筹划在2026年新增更多海外办事节点,重点助力中国企业、尤其是一带一路沿线市场的出海营业成长。
二、算力决胜点:场景与成本
算力资本完成初步沉淀后,若何将裸金属高效转化为开辟者可用的“数字燃料”,成了算力运营商必须答复的命题。
并行科技董事长、CEO 陈健:AI Coding主导Token需求,「高效、稳定、低成本」将成为算力办事竞争核心

2025年,人工智能范畴经历了一场由范围化应用驱动的深刻变革,大年夜模型Token调用量爆炸式增长,这一变更直接激发了算力供需关系、技巧优化核心和家当竞争格局的连锁反响。
作为衡量大年夜模型应用范围的核心指标,日均Token调用量在2025年实现惊人冲破,全市场Token应用量同比增长300倍,且全球Token技巧标准同一,采取开源模型的企业出现一致成长态势。
一方面,Token需求暴涨的重要场景是AI Coding,业界猜测到2030年,绝大年夜多半代码将由AI主动生成,这既是IT行业的自我改革,也是AI成为通用技巧的基本。2025年全年,Token应用量的一半集中在AI Coding范畴,也标记住大年夜模型正式进入范围化临盆阶段。
不过,在我看来,Token应用量激增的核心诱因是成本优化。2025岁首年代,DeepSeek凭借极高的机能与成本优势,实现了Token成本10倍的性价比晋升,将大年夜模型应用门槛降低一个数量级。
在这波海潮中,并行科技也成功将在线办事的Token成本大年夜幅降低,从一百多元降至几元,离线模式更是可能降至1元以下,主力Token成本整体降低近30倍,TPS(每秒Token输出量)也晋升10倍,达到行业前沿程度。
回望2025年,市场出现“一卡难求——供大年夜于求——岁尾优质卡一卡难求”的快速轮回。需求端看,我和团队认为,当前重要分为三类:头部大年夜模型企业的超大年夜范围练习需求(企业数量缩减至不足20家,但单家需求量翻倍)、推理办事需求(含Token生成,达万卡级别且快速增长)、科研研发需求(稳步增长)。但供给端一侧,则因2023-2024年小范围智算中间无序扶植、供给链不稳定等影响,供给形势多次反转。
对此,并行科技采取“弹性供给”和高效资本调剂策略,使自有GPU算力应用率在2025年上半年达到85%-90%的饱和状况,且在12月市场转向供不该求前,经由过程多次大年夜范围采购提前锁定优质算力资本,安闲应对2026岁首年代优质算力“一卡难求”的格局。
但2025年算力市场带来的挑衅仍在持续:受AI需求暴涨与产能不足的双重影响,全球显存、GPU显存、内存及闪存等存储产品大年夜幅涨价,直接导致办事器成本翻倍,严重制约了算力资本的扩建过程。
不过,在这之中,也蕴含着国产算力的重要成长机会。从政策层面和本钱市场资金流素来看,国产算力正在出现出百花齐放的态势,从小范围适配迈向大年夜范围单集群生态扶植的新阶段,既强调“大年夜范围”构造,也重视“生态”适配,加快与国际市场接轨。
2026年,行业对将来已经杀青这些共鸣:一是推理需求持续主导,跟着模型大年夜范围安排,推理所需的算力范围和复杂度将远超练习,成为算力消费的绝对主体;二是Agent成为主流形态,大年夜模型应用正从单一问答向能筹划、履行、应用对象的智能体演进,请求底层办事架构重构;三是价值重心上移,将来竞争核心不在于纯真拥有算力,而在于可否供给高效、稳定、低成本的模型办事和AI应用。
总结而言,2026年将是AI大年夜范围贸易化应用的元年。
成本之外,门槛仍在。若何让非技巧背景的企业能在多样化的算力架构上,自由地发展出属于本身的Agent生态?
九章云极 CEO 方磊:摒弃「范围噱头」,场景适配才是智算家当的关键「胜负手」

这些变更让行业面对很大年夜挑衅,但也带来成长机会。
站在2026年的新起点回望,2025年算力市场最大年夜的变更,就是彻底拜别了“盲目堆硬件”的狂热,从“CPU云主导”迈入“GPU云崛起”的关键转型期。

我和团队最直不雅的领会是,2025年行业核心瓶颈集中于“供需错配”与“效力不足”。
一方面,传统CPU云适配通用计算,与AI高并行、密集型需求存在本质抵触,而“CPU+GPU混淆数据中间” 既举高了成本,又制约了GPU机能的释放;
另一方面,算法从“深度进修”向“强化进修”跃迁,算力呈十倍、百倍级增长,但行业GPU平均应用率仅70%阁下,且“裸金属租赁”模式门槛高,导致中小企业与开辟者难以高效应用算力,克制家当立异活力。
同时,算力需求已进入集中爆发期:端到端模型练习、仿真测试、车路协一致场景,都须要10倍以上的算力支撑,对算力的稳定性、泛在性提出了更高请求。从全球格局看,国外头部企业聚焦超大年夜范围算力集群与专用芯片研发,核心办事于高端练习场景,但昂扬的成本与封闭的生态体系,让广大年夜中小企业难以触及算力资本。
一方面,市场上AI大年夜模型数量快速增长,请求芯片厂商能广泛且高效地适配;
2025年,九章云极推出智算云平台,依托Serverless与强化进修相干技巧,实现了万卡至十万卡级异构算力的同一调剂,将AI智能体训推流程简化至一行代码即可启动,让更多主体可以或许介入到AI立异中来。
与此同时,行业正经历关键跃迁:竞争核心从预练习时代的“拼范围”到后练习时代的“拼效力”,强化进修作为驱动模型进化的核心引擎,已成为下一代智算基本举措措施的刚性需求;智能体已从“纯对话交互”,转向“复杂义务履行”,工业控制、流程主动化、城市治理等实景场景,催生出海量碎片化、动态化的算力诉求。
基于此,我们团队也在两个偏向上发力:
一方面,持续推动强化进修云的工业级落地,以全异步练习架构、离线回放算法等核心技巧,让中小企业无需承担昂扬投入即可完成专家模型练习;
印象里最焦炙的时刻,可能是春节后在各类平台上适配优化DeepSeek模型:当时我们发明,DeepSeek在一些平台上很轻易能运行起来,但在另一些平台上却会见临很多挑衅,算力平台之间的差距异常大年夜。
另一方面,针对智能体“履行化”转型需求,打通强化进修云与对象调用、复杂工作流的适配,延续按度计费的模式,支撑一行代码启动练习、推理、履行,从而匹配从机械人调剂到城市筹划的多元动态算力需求。
固然当下行业里仍有“算力多余”“企业无真实算力需求”的声音,市场也在纠结“是否要加快推动大年夜范围、大年夜体量算力构造”。
但我们始终保持本身的断定是,AI基本举措措施仍处于成长上升期,经久潜力巨大年夜。将来有才能开展模型练习的主领会持续增多,算力需求的增长空间远未触顶,所谓“算力多余”只是短期供需波动的阶段性现象,而非行业终局。
市场的反馈与实际体感也在印证我们的断定:Forrester调研显示,45%的中小企业选择智算云办事,12%的自力开辟者将其作为核心支撑,企业对AI算力的应用逻辑已转向“经济、弹性”,依托我们的智算云,部分客户成本直接降低了40%。
最后,我想说说我对这个行业的懂得:行业的胜负手不是谁的GPU更多,而是谁能放下“范围噱头”,深耕场景适配,把算力变成企业“算着清、用得好”的基本举措措施。
Context Window带来巨大年夜内存消费、高带宽DRAM走向供需掉衡,需求端的反向施压,为立异性技巧筹划的实现供给机会。
昉擎科技 CEO 梁军:Agent爆发与供给趋紧,AI基本举措措施迎来「立异成长」窗口期

比来还让我震动的是,Cursor的CEO拿GPT 5.2写了三百多万行代码,根本复现了chromium 浏览器,要知道写浏览器的难度挑衅和操作体系是一个级其余,由此可以看出,AI已经几乎没有写不了的代码。
然而,上层应用的繁华与底层算力的就绪之间存在明显的时光差。
针对Sparse MoE模型的计算特点,AI Infra在以前一年里实现了多层面的深度优化,但因为芯片有固定的开辟节拍,除了华为超节点筹划外,国内其他芯片厂商的对应产品仍处于开辟阶段,这也制约了相干营业的增长。
瓶颈的出现,让行业在设计、安排Scale-Up集群上敏捷杀青共鸣。UALink、SUE及ESUN等Scale-Up通信协定标准进展异常敏捷,家当链配套的通信协定IP、Switch、支撑Scale-Up接口的算力芯片,以及Scale-Up集群硬件等各类产品的开辟进展也周全提速。
另一方面,行业供给形势持续趋紧:除了众所周知的高带宽DRAM供需掉衡,还有不少部件、材料都面对供给重要的景况。
这一重要态势并非纯真的周期性波动,而是应用范式变革对资本需求的构造性重塑。
与此同时,Agent普及带来的low latency(低时延推理)需求,正从需求端反向施压,对体系软硬件设计产生深远影响。
Agent应用的爆发式增长,既要知足超长Context Window(高低文窗口)带来的巨大年夜内存消费,又需将Token成本紧缩至极致。
从模型、应用、AI Infra到底层软硬件,各层面均在高速迭代演进,客不雅上催生了巨大年夜的市场机会,也为立异性技巧筹划的落地供给了宝贵的窗口期。
这一窗口属于敢于冒险、善于体系性思维的团队。在诸多灾题与挑衅之下,我们始终保持以高标准筹划和更基本性的方法求解,这也让我们团队收成超出预期的成果。
以前一年我们的多次实践,都在赓续验证这一办法论的有效性,也让我们面对将来的信念加倍果断。
Token需求进入爆发期后,底层硬件碎片化的“互联墙”不容小觑,行业要若何避免让算力集群沦为机能孤岛?
奇怪摩尔 CEO 田陌晨:「互联碎片化」成超节点瓶颈,AI下一战拼的是交付

这波AI的成长,对硬件提出了双重挑衅:
作为基建中同样重要的介入者,云厂商在AI时代的护城河会是什么?
另一方面,大年夜模型范畴技巧迭代极快,多模态、世界模型等立异层出不穷,如今,市场重心也已经明显转向:一是从寻求范围扩大,转向深耕机能;二是从“生成式AI”,转向“AI Agent”这一形态。
尤其在推理场景中,不合应用处景对Prefill(预填充)与Decode(解码)阶段的需求不合,对时延、精度、功耗、靠得住性等方面的侧重点也不合,这些都邑直接影响计算、互联与存储等各个模块的设计。
我们从2021年起,就预感到AI快速成长将面对的收集互联瓶颈,在构造片内互联芯粒产品后,也慢慢构建起面向AI收集互联的全栈解决筹划。
然而,这一路并非坦途:
2024年,我们已前瞻性地在超节点范畴进行了技巧和资本构造,但那时刻“超节点”概念还没有火起来,我们的工作显得有些“超前”,这使得公司当时的本钱化过程一度有些阻力。好在,有中科创星等早期投资人持之以恒的信赖,以及客户和合作伙伴的并肩同业,到2025年,超节点成为AI训推集群的关键技巧核心。
不过,制约超节点安排效力与可扩大性的核心瓶颈,也随之浮现:
超节点内部的各个计算单位,要依附同一、高效的互联协定,才能实现协同。然而,今朝还没有出现像以太网或移动通信那样成熟且被广泛回收的标准体系,这就导致不合厂家的设备很难兼容、互通,交换机和计算节点之间的对接方法,都是各家本身定制,这让体系集成和后期保护都变得更复杂且麻烦。
尽管比来两年间,国表里已出现出多项致力于推动标准化的倡议与规范,如SUE、OISA、ETH-X、UALink等。然而,“生态碎片化”的解决并非纯真的技巧比赛,而是要依附于家当链高低游的慎密协作。在我看来,短期内,多元技巧标准并存的格局还会持续。
针对这一情况,奇怪摩尔推出超节点互联芯粒Kiwi G2G IOD——基于我们独创的HPDE可编程架构,能支撑不合的协定类型及其进级。
并且,早在2023年,奇怪摩尔便作为首批核心生态成员,深度介入由中国移动牵头的OISA 1.0协定制订工作。2025年,公司进一步介入到OISA 2.0协定的制订中,负责制订了协定中互联芯粒部分的标准设计,还开辟了业界首个OISA Scale up协定的验证平台。
2026年,我信赖超节点的热度仍会持续,且会进一步家当化。这背后也指向一个关键共鸣:AI时代的竞技场,胜负在于交付——无论是触达用户的最终应用,照样支撑一切的底层硬件,真正拉开差距的,都是交付。
清程极智 CEO 汤雄超:「单向适配」不是终局,将来模型与芯片架构设计要互相指导

客岁,我们比较存眷大年夜模型的推理安排场景。
经由团队的尽力,我们在几个月后终于实现了筹划中的近10种算力平台的推理安排筹划。比较当时,其实可以明显感触感染到,国产算力对新宣布模型的支撑速度已经大年夜幅晋升——
从最初模型宣布数月后才能完成适配,到后交往往新模型宣布后几天即可适配。客岁WAIC大年夜会时代,清程极智的“赤兔”推理引擎更是实现了国产算力对新模型的0 Day支撑,让GLM4.5模型宣布当天就能在华为昇腾算力上推理安排。
适配速度的加快,表现了国产算力上的软件生态赓续成熟。本岁首年代,我们和T-One孵化器结合宣布了一份大年夜模型API办事行业申报,在和几十家做大年夜模型API办事的伙伴沟通后发明,国产算力是真实可用的,但与此同时,硬件架构差别带来的问题,无法经由过程软件手段完全解决。
以往大年夜家认为,软硬件分别面对生态成熟度与绝对机能上的差别,但到了2025年,新兴大年夜模型算法架构与国际先辈算力的硬件架构绑定得加倍慎密,其影响已经超出平日意义上的“软件生态”范畴。
例如,去岁首年代开源的DeepSeek-V3/R1模型,是基于FP8数据精度原生练习与推理的,但当时国产算力硬件架构并不支撑FP8。我们预认为后续会有更多模型采取FP8、FP4这类新兴低精度数据类型,于是,清程极智就经由过程软件的方法,在国产算力上实现了FP8精度的计算,后来又进一步完成了FP4精度的软件支撑。
但这仅仅解决了易用性问题,让用户能在国产算力平台上快速跟进最新大年夜模型与数据精度,却无法从硬件底层真正晋升模型的实际运算速度。
而如今,低精度算力已逐渐成为智能算力的主流设备。在海外高端算力芯片中,FP4算力广泛能达到BF16算力的6-8倍。假如国产算力只是在BF16算力上追平海外产品,却没有在硬件层面补齐对FP4精度的支撑,那么其真实有效算力依然只有海外芯片的零头,很难形成性价比优势。
好在客岁很多国产算力厂商鄙人一代芯片筹划中,都提出将支撑低精度的算力类型,比如昇腾950就支撑FP4。估计2026年,硬件架构的差别有望进一步缩小。
但在我看来,国产算力在硬件架构上慢慢对齐海外特点,还只是早期阶段。根本的解决筹划,应当是国产算力和大年夜模型研发机构更慎密地合作:让大年夜模型算法的成长需求指导芯片架构的设计,芯片架构也反过来指导大年夜模型的算法设计。
放眼2026,大年夜模型推理对算力的需求仍将保持高速增长,并且,无论是大年夜模型算法架构照样底层硬件设计,都邑加倍多样化——
模型方面,客岁主流照样基于自回归解码的文本类模型,本年则会出现更多扩散模型与多模态模型;算力方面,除了类GPU架构和NPU架构,一些架构更激进的算力也将开端量产。在如许百花齐放的格局下,可能会碰撞出新的“硬件-算法”协同的行业最优解。
国产算力在功能上已经能知足大年夜量实际场景的需求,但在绝对机能和性价比上,仍需进一步晋升,才能真正建立贸易优势。这须要全行业合营尽力,实现市场化的正向轮回。
四、颠覆全栈
最后,当底层技巧栈慢慢打通、Agent 真正成长为新一代操作体系,一个更重磅、更根本的命题也随之到来:
人类,是否已预备好向 AI 移交决定计划权?
PPIO CEO 姚欣:敢不敢放权给AI,是属于人类的「奇点时刻」

以前业界将2045年视为“奇点邻近”,认为跨过奇点后,智能将指数级迭代、机械进化速度会远超人类。但在我看来,2025年已经由了奇点的拐点。
回看客岁,DeepSeek的爆发让我们团队很高兴。一季度我们快速加码算力、对接需求,全力冲刺MaaS营业增长。但到了五六月,市场风向忽然改变——开辟者更偏向选择海外价格更高的闭源模型。
我们不仅须要把控产品本身的才能,还必须兼顾各类场外身分——早年期的工地勘察、架构扶植,到中期的物流运输、测试模仿,再到后期的集群构建和优化保障,每个环节都要兼顾到位,挑衅很大年夜。
这一度让我们陷入焦炙:PPIO核心营业MaaS,跟开源模型生态互相干注,只有开源模型足够强,才能带动MaaS和算力需求增长。但我始终对开源异常果断——从PC互联网到移动互联网,历次海潮几乎都遵守“闭源开辟、开源统治”的规律,这一轮AI海潮也不会例外。
所以我们保持到九月十月,终于,国内大年夜模型迎来爆发。邻近春节这段时光,我们也几乎天天都在对接新模型,春节大年夜家可能也歇息不了。这个过程对我们来说,痛并快活着。
不过,模型才能只是单点冲破,我们始终信赖Agent层才是开辟者真正的“操作体系”。客岁Agent技巧栈还不成熟,大年夜多逗留在概念与雏形阶段;但春节前OpenClaw的出生,已经让行业看到全新的机会和欲望。
在这背后,我也看到了技巧偏向上的“会师”:OpenClaw这类Agent的“权力”太大年夜了,有很大年夜的安然隐患。可见,今天的AI基本举措措施,已经不再仅仅是为人设计,同时也要为AI办事——高弹性、高并发、高义务响应、甚至长时记忆才能,都是AI原生的核心需求。
这也直接拉高了对硬件团队的请求:
软件技巧演进常以“季度”甚至“月”为单位,芯片等硬件的迭代周期却平日长达数年,是以,硬件研发团队不仅要精晓软硬件深度技巧、具备跨范畴视野,还需具备前瞻性,可以或许预判将来两至三年的技巧需求,以提前筹划硬件设计。
作为经历过互联网,移动互联网多个时代的持续创业者,我认为当下又是一个重大年夜的技巧范式变迁,我们以前的各类软硬件都是针对人的应用体验设计的,然则行业正从“以人应用为中间设计Infra”,转向“以AI或机械为中间设计的Infra”。我们客岁推出的Agent沙箱体系,正好就可以成为Agent Infra的核心组件——在保障高效运行的同时,实现安然隔离与风险可控。
与此同时,在需求爆发的背景下,算力的梯次应用与精细化调剂也变得至关重要。将来算力需求的增长速度会大年夜幅领先于今天年力供给速度,行业会进入一段经久供不该求的时段。
我在本届CES不雅察到,GPU行业已在为产能实现十倍、百倍增长做预备,但其他组件完全没跟上,比如硬盘,以前20年每年的产能只上涨平均3%-5%。这就意味着,我们已经进入到基本举措措施的综合博弈,木桶短板效应会合中爆发。
是以,我们本年的目标也很明白:全栈化和全球化。前者是打通从IaaS、MaaS到Agent Infra的端到端技巧才能;后者则是依托不合区域的资本优势,在日本、欧洲、东南亚等地进一步构造,发掘更多元的算力供授与市场机会。
我还有个不雅察:将来制约AI普及与应用深度的关键,不在于技巧或算力,而在于企业组织才能可否跟上AI的迭代速度。
本年我会在公司内部推动周全向AI Native组织转型。这背后是一个根本生命题:当机械在效力与智能程度上周全超出人类时,组织与治理者是否敢于放权?
假如我们的决定计划依然依附冗长流程、寻求100%绝对安然、所有事项最终都须要CEO签字确认,决定计划效力必定被严重制约。这就是人类史上又一把 “达摩克利斯之剑”:在安然与效力、稳定与进化之间,若何做出决定?
这将是人类自身的奇点时刻。
作者经久存眷AI算力链条,迎接添加作者微信 Ericazhao23 交换。雷峰网("大众,"号:雷峰网)雷峰网
雷峰网原创文章,未经授权禁止转载。详情见转载须知。

发表评论 取消回复