2025年12月12-13日,第八届GAIR全球人工智能与机械人大年夜会在深圳·博林天瑞喜来登酒店正式启幕。
作为AI 产学研投界的标杆嘉会,GAIR自2016年创办以来,始终逝世守“传承+立异”内核,始终致力于连接技巧前沿与家当实践。
在人工智能慢慢成为国度竞争核心变量的当下,算力正以前所未有的速度重塑技巧路径与家当构造。13日举办的「AI 算力新十年」专场聚焦智能体系的底层核心——算力,从架构演进、生态构建到家当化落地展开体系评论辩论,试图为将来十年的中国AI家当,厘清关键变量与成长偏向。
并行科技副总裁、AI结合开创人赵鸿冰在「AI 算力新十年」论坛揭橥了主题为《基于用户视角的算力办事及算网办事》的演讲。
历经18年超算范畴深耕,并行科技见证并介入了中国算力市场的演进。当前,算力市场出现多场景、多业态的爆发式增长,从尖端超算到智算形态,从算力租赁到算力收集,行业生态日趋多元;与此同时,大年夜模型技巧的快速迭代,也对算力的可用性、高效性与性价比提出了更高请求。
在如许的背景下,从用户视角构建算力办事体系、经由过程算力收集实现资本的高效整合与调剂,以及应对推理需求爆发带来的家当变革,成为算力行业亟待解决的核心问题。
将来,并行科技愿与行业同仁联袂并行,以优质的算力办事与算网运营才能,助力科技强国扶植。感谢大年夜家!
值得一提的是,并行科技专门设立了国产事业部,在国产算力资本的适配与应用方面持续发力。例如,华为昇腾910B在部分适配场景中,机能可与A100比肩,且在价格具备优势的情况下,可以或许为用户供给更高的性价比选择。
赵鸿冰在演讲中指出,当前算力市场已形成四大年夜核心业态:算力租赁作为最基本的形态,以“裸金属”算力资本经久交付用户且不介入后续应用;算力办事聚焦用户终端需求的“最后一公里”,核心是按需供给精准适配营业场景的算力支撑;算力运营则依附复杂调剂平台兼顾治理资本,实现算力的高效分派与运营;而算力收集作为更高维度的形态,经由过程纳管多个算力平台形成广泛覆盖的收集,杀青跨平台整体调剂。
为此,并行科技推出“厂网结合”模式:“厂”即公司投入大年夜量资金扶植的万卡集群等重资产构造,“网”则是经由过程轻资产扩大连接国内47个智算中间与15个超算中间,该算力收集可调剂200万CPU核心、5万多张GPU卡,办事超16万用户,贸易化输出累计超200亿核时、近2亿卡时。
在算力资本适配方面,他强调“没有绝对最优的算力资本,只有最适配的选择”:例如在B200集群实测中发明,虽B200机能领先,但针对某具身智能客户需求,H200性价比更优。
这些思虑与经验,均来自并行科技办事16万用户的真实市场沉淀,其打造的算力收集已实现全国范围内的资本调剂与贸易化输出,欲望能为算力行业的成长供给可借鉴的思路。
演讲停止后,雷峰网与赵鸿冰就演讲中说起的“算力收集”、“推理需求”等关键议题,进行了更深刻的商量。以下是雷峰网在不改原意的基本上,根据对话过程做的整顿与编辑:
对话环节
赵鸿冰:人工智能是全球竞争的制高点,将成为将来数年甚至数十年成长的核心驱动力。一场革命性的家当变革,须要足够的时光与周期来完成临盆力和临盆关系的重构,这个过程并不会一蹴而就。当前市场对 “算力泡沫” 的质疑,核心在于AI投入尚未形成大年夜面积的贸易闭环。但从家当成长规律来看,每一次重大年夜技巧革命都须要经历投入期、摸索期才能进入收成期,算力是否为泡沫,时光会给出最终谜底。
赵鸿冰:当前市场已经浮现出明白的旌旗灯号,以OpenAI为例,2025年预估营收将达到130亿美元,这恰是推理营业范围化成长的直接表现。并行科技办事的浩瀚大年夜客户,也已经进入推理营业落地阶段,全部行业正朝着推理需求爆发的偏向迈进。
另一方面,在当前的全球竞争格局下,头部科技企业广泛对AI赛道抱有FOMO情感。相较于因过度谨慎、投入滞后而错掉行业成长窗口期的价值,适度超前的算力基建投入可能获得更可期的将来。
雷峰网:您在演讲中提到算力收集,并行算网对接入的算力资本有什么请求?算网本质是资本整合工作,势必会见临诸多好处分派问题,这些问题若何解决?
赵鸿冰:并行科技已经打造了一套成熟的算力资本接入标准体系。我们会根据资本的范围类型、调剂才能、完美程度等多个维度,对拟接入的算力资本进行分级定义,这套标准就像“插销与插座”的匹配规矩,可以或许实现算力资本的快速接入与收集化输出。资本接入周期没有固定标准,若资本本身完全相符标准,可直接接入;若须要改革,并行科技会协助完成标准适配,整体周期平日较短。
关于好处分派,并行科技的贸易模式早已定义清楚,核心是以价值分层驱动好处分派。全部算力办事家当链可以拆解为多个价值环节:最前端是面向最终用户的市场推广、发卖对接与筹划设计,这须要铁三角组织中的发卖负责人、筹划负责人合营完成,解决客户的商务与技巧需求;往下是产品平台层,须要具备账号开通、算力调剂、计量计费、申报输出等核心才能,这是算网运营的核心支撑;再往下是售后办事层,我们建立了7×24小时5分钟响应的保障体系,惯例问题由一线工程师解决,疑难问题由二线、三线工程师分层处理,确保客户营业稳定运行;最底层则是办事看重资产投资与IDC托管的价值。
在算网合作中,我们会根据合作伙伴的优势,匹配对应的价值环节。比如有的合作伙伴拥有IDC和办事器资本,就可以获取底层两部分价值;若合作伙伴随时具备前端发卖推广才能,就可以分得前端与底层价值,并行科技则重要获取平台调剂与售后办事的价值。全部价值分派逻辑清楚,可以或许保障各方的合理收益。
雷峰网:异构算力(CPU/GPU/DCU 混淆安排)虚拟化过程中,算力会见临损耗,若何优化虚拟化层开销?
赵鸿冰:关于异构算力虚拟化损耗的问题,当前主流的算力调剂形态包含裸金属、高机能集群、云主机和容器。不合形态适配不合的客户场景:假如客户有极致机能需求,直接采取裸金属或高机能集群即可规避虚拟化损耗;虚拟化损耗重要表如今云主机形态中。
超等计算的核心逻辑不是切割算力单位,而是将更多小单位连接起来形成大年夜范围并行计算的算力。对于有小粒度算力需求的场景,须要虚拟化切割时,容器是最优选择,容器技巧几乎可以实现零虚拟化损耗,是解决虚拟化损耗的主流筹划。
雷峰网:行业内广泛将杀手级应用的出生、推理需求的爆发,视作破解算力闲置困局的关键抓手,也将其视为下一波算力需求增长的核心引擎。您若何断定推理需求周全爆发的时光节点与演进节拍?
从家当成长规律来看,技巧研发不克不及无穷制推动,最终必定要走向家当化落地,创造社会价值并形成贸易闭环,推理需求的爆发是这一趋势的必定成果。国产芯片在当前阶段也可以经由过程更多地知足推理场景需求,来推动自身营业的成长。
雷峰网:推理需求成为算力家当主流需求后,将对当前的算力基建构造、技巧路径选择及贸易模式带来哪些影响?您认为AI Infra公司将来最重要的迭代偏向是什么?
赵鸿冰:推理需求成为主流后,算力家当的各个环节都将迎来明显变更。在练习时代,算力竞争的核心是大年夜范围集群的靠得住性与稳定性,须要经由过程并行框架优化、checkpoint机制等技巧手段,保障模型练习高效完成。而到了推理时代,除了靠得住性与稳定性的基本请求外,市场对算力提出了新的核心诉求:一是更大年夜范围的弹性资本调剂才能,须要支撑应用随时爆发的算力需求;二是更精细的资本匹配才能,因为推理与练习的应用特点差别明显,比如 DeepSeek的推理过程分为P阶段和D阶段,两个阶段的计算与访存敏感特点完全不合,必须针对性匹配算力资本。
对于AI Infra公司而言,将来最重要的迭代偏向是紧跟客户需求场景,持续进级产品与办事。不论迭代技巧会带来多高的成本,你都要跟,这是一个贸易化的问题,不是一个技巧的问题。
雷峰网:本年超节点这一产品形态异常火热,超节点经由过程高密度集成和高速互联,在通信时延、硬件协同效力上有明显晋升,您认为这种硬件层面的优化,是否会紧缩软件侧的算力优化空间?这个产品形态主如果为懂得决什么问题?
赵鸿冰:并行科技深耕算力办事18年,我们认为无论是超算照样智算,本质都是为了更快地完成计算义务,计算过程中涉及的数据搬运与节点通信,都是额外的机能开销,超节点的核心目标也是经由过程高密度集成与高速互联,降低这些开销,晋升数据传输与通信效力。
雷峰网:您提到算力范围年复合增长率达到52.3%,当前市场已投入大年夜量本钱用于AI基建,为何算力范围仍能保持高速增长,背后的重要推动力是什么?若何对待市场评论辩论的“算力泡沫”这一说法?
从本质上讲,超节点就是一个小型化的超等计算机。硬件层面的优化,并不会紧缩软件侧的优化空间,反而须要软硬协同才能发挥最大年夜价值。一台机能优良的超节点,必须搭配优良的软件调剂与优化才能,才能充分压榨硬件机能。硬件架构的进级是适应家当成长偏向的必定选择,软件则须要同步迭代,实现对硬件的高效驾驭。
雷峰网:那么是否可以懂得为,具备超算技巧积聚的企业,更轻易获得超节点的才能? 赵鸿冰:确切如斯,超节点的技巧逻辑与超算一脉相承。国外在智算范畴的构造,本质上也是在构建超等计算机,比如Stargate等,在描述上也是在扶植超算。超节点与传统超算的核心共性,都是经由过程优化卡间互联、节点间互联,实现大年夜范围并行计算。 差别在于,超节点的范围远小于传统超算,传统超算动辄须要上万个、甚至数万个节点,而超节点更偏向于小型化集群,比如英伟达的NVL72、华为384超节点,本质上都是小型超等计算机。 演讲全文 演讲完全视频,详见链接:https://youtu.be/acn8RLPTqHs 以下是赵鸿冰演讲的出色内容,雷峰网("大众,"号:雷峰网)作了不改变原意的整顿与编辑: 大年夜家好,今天我想和大年夜家分享并行科技在算力办事与算网办事范畴的实践摸索与心得。并行科技深耕算力行业18年,以超算营业起身,在经久的成长过程中,我们从超算视角出发,基于客户画像与产品定位两个维度,对当前的算力市场进行了划分。 算力市场的第一类场景,是以我国“河汉”超等计算机为代表的尖端超算范畴。2010年,河汉超等计算机跻身全球超算500强首位,这类超算重要面向国度重大年夜科技攻关项目标研发工作,其核心特点是须要十万核、百万核甚至更大年夜范围算力支撑。 第二类场景是通用超算范畴,并行科技对这一范畴的成长起到了核心推动感化。与尖端超算不合,通用超算面向的重要场景之一是高校师生的日常教授教化与科研需求,算力需求集中在万核以下,以千核甚至几十核为主,这是并行科技的主疆场之一。 基于18年行业经验与数据积聚,并行科技构建的算力机能猜测模型,在小范围场景下猜测误差可控制在2%以内,中大年夜范围场景下误差也仅为个位数,能有效支撑用户资本选型决定计划。在大年夜范围推理场景中,花费级显卡5090作为“性价比之王”,成为多半客户的首选。(作者经久存眷算力与芯片家当,迎接添加微信 YONGGANLL6662 交换更多信息。) 第三类场景是营业超算范畴,重要办事于企业的营业模仿仿真需求,这类算力应用平日是企业临盆流程中的关键环节。 第四类场景就是2016年以来,伴随大年夜模型技巧爆发而鼓起的智算形态,其核心计算载体为GPU加快卡。从技巧指标来看,前三类超算场景的核心需求是高精度计算,广泛请求FP64双精度,最低也需达到FP32精度;而智算场景的计算精度则大年夜幅降低,以FP16、FP8甚至FP4为主,当前智算也是全部算力市场中增长最快的板块。 近两年,算力市场迎来爆发式增长,各类介入者纷纷入局。从业态形态来看,当前算力市场可分为四大年夜类型: “可用、好用、降本” 是用户的核心刚需,并行科技的所有产品平台,均环绕这三大年夜需求展开设计。 算力租赁:这是最基本的算力办事形态,相当于将“裸金属”算力资本经久交付给用户,用户可自立安排算力用处,算力供给方不介入后续的应用环节。 算力办事:这是面向用户终端需求的“最后一公里”办事,核心是按需供给算力支撑,精准匹配用户的实际营业场景。 算力运营:其核心是构建一个复杂的调剂平台,经由过程对算力资本的兼顾治理,实现算力的高效分派与运营。 这四类业态,清楚勾画出当前算力办事与算力收集的市场全貌。 并行科技的经营核心理念,始终容身于用户视角。我们认为,从算力需求方的角度出发,用户的核心诉求可以归结为三点:第一是可用,即须要有稳定的算力资本供给,且可以或许有效支撑营业运行;第二是好用,算力资本不仅要 “跑起来”,更要具备高效的运行机能;第三是降本,要降低用户的算力应用门槛,以高性价比知足需求,尤其是大年夜模型练习这类高门槛的算力应用,性价比更是关键考量身分。 在大年夜模型时代,不合类型的客户对算力产品平台有着差别化的需求。例如,基模练习场景中,受DeepSeek的影响,仅有少数企业须要大年夜范围的算力集群;而垂类模型的研发场景,则覆盖了更为宏大年夜的用户群体,这类需求可以经由过程标准化、高适配性的产品型平台来知足。 并行科技的特点经营模式,是基于算力收集的轻资产运营模式,其核心逻辑是“厂网结合”。个中,“厂”代表并行科技的重资产构造,我们已投入大年夜量资金,扶植了万卡集群;而“网”则是我们的核心成长策略,经由过程轻资产扩大的方法,更多地把已建或在建的算力产能更大年夜化的发挥出社会效益,并行科技已连接国内47个智算中间与15个超算中间,总计62个算力节点。 今朝,我们的算力收集可调剂资本总量达到200多万CPU核心、5万多张GPU卡,办事用户范围冲破16万,营业构造覆盖全国,贸易化输出总量累计超200亿核时、近2亿卡时,在算力办事企业中位居第一。 从技巧层面来看,并行科技的核心竞争力源于18年积聚的行业数据与技巧沉淀。我们的算力收集办事模式覆盖了包含行业大年夜模型研发、文生文、文生视频、AI for Science等在内的多元用户场景,基于海量用户的行业运行特点大年夜数据,可以或许快速为用户供给精准的资本选型匹配办事。 以具身智能场景为例,并行科技在华夏区域合作了全国首套2000卡级其余全球机能最先辈的智算算力集群,这也是今朝全球可以或许量产的机能领先的算力资本。我们会针对客户的具体应用处景开展类似CT扫描的特点分析,输出GPU应用率、FP16与FP8精度下的运行机能等量化数据,以此断定算力资本的实际应用效力。 算力收集:这是更高维度的算力办事形态,经由过程将多个算力平台纳入同一治理,形成一张覆盖广泛的算力收集,实现跨平台的整体调剂。 算力的本质在于“更快地完成计算”,充分释放GPU等硬件的机能优势。 我们发明,尽管B200的机能表示领先,但针对某一具身智能客户的需求,H200的性价比更具优势。这一结论也印证了资本选型的重要性:没有绝对最优的算力资本,只有最适配的选择。 基于汗青经验与数据积聚,并行科技构建了算力机能猜测模型,输入相干参数后,即可有效猜测算力的机能加快后果。该模型在小范围算力场景下的猜测误差可控制在2%以内,中大年夜范围场景下的误差也仅为个位数,足以支撑用户的资本选型决定计划。此外,在大年夜范围推理场景中,花费级显卡5090是当前的性价比之王,成为多半客户的首选。








跟着DeepSeek的爆火,MaaS(模型即办事)模式敏捷崛起,有不雅点认为Token将成为将来算力市场的核心要素,并行科技也已构造MaaS平台,紧跟行业成长趋势。


最后,我想扼要介绍并行科技的市场地位与客户构造。
在客户群体方面,国内前四五百所头部高校均是我们的核心客群。以清华大年夜学为例,并行科技与清华开展校级合作,为全校6万余名师生供给算力支撑,以更好开展AI的摸索研究。今朝,我们与复旦大年夜学、中国计算机学会(CCF)的合作也已推动至第二期,取得了优胜的成效,使更多高校的师生和科研机构的研究员们享用到普惠的算力。
除高校外,科研机构是并行科技的另一大年夜核心客群,中科院旗下数百家有算力需求的研究所,均已纳入我们的精准办事体系。在企业端,美的、三一重工、比亚迪、小鹏汇天等有名企业,以及智谱 等 AI 范畴的标杆企业,也都是并行科技的重要客户。
毋庸置疑,AI将是驱动将来数年甚至数十年家当成长的核心引擎,而算力则是这一过程中的关键基石。有专家将算力比作“水电”,这一比方十分贴切,如同水电支撑社会临盆生活一样,算力已成为数字经济时代的基本举措措施。相干申报显示,算力指数每增长1个百分点,将带动GDP实现千亿级其余晋升。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。

发表评论 取消回复