首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

作者|包永刚

编辑|林觉平易近

仲冬的北京略带寒意,但摩尔线程首届开辟者大年夜会(MDC)会场内热度实足。1000平方米的展区汇聚了上千位开辟者,他们存眷智能机械人、数字人、Agent等前沿技巧,也在商量AI for Science、气候猜测等尖端应用。

展区中心的数字文娱与视频多媒体区最为惹人注目:有人沉浸在eVTOL全动飞翔模仿器的操控体验中,也有人在国产GPU驱动的经典拳皇和3A大年夜作的游戏世界里鏖战。“国内能展示街霸游戏的,今朝可能只有我们。”一位工程师点出了摩尔线程在一众AI算力卡中,同时具备图形才能的稀缺性。

假如只是经由过程文字或视频懂得摩尔线程这家国内为数不多做全功能GPU的公司,可能只是一个模糊概念。身处展区,一次性展示十个 GPU 的应用案例,足以让人懂得 GPU 的一部分价值;而当近百个应用同时铺开时,带来的则是双重冲击——一方面是对全功能 GPU 才能界线的直不雅感知,另一方面,这些应用案例全部来自一家仅成立五年的国产 GPU 公司。

摩尔线程将全功能GPU的才能转化为覆盖从花费到垂直行业、从图形到AI再到高机能计算的广泛应用,这不仅是其独特价值的具象化出现,也让人切实感触感染到全功能GPU的“奥义”地点。

首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

中国工程院院士、清华大年夜学传授郑纬平易近

正如中国工程院院士、清华大年夜学传授郑纬平易近所言:“做GPU必须同时支撑三个特点:完全的图形流水线、张量计算核心以支撑AI,以及高精度浮点单位知足高机能计算。”

首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

摩尔线程开创人、董事长兼CEO张建中

摩尔线程开创人、董事长兼CEO张建中指出:“全功能GPU内置多种计算引擎,涵盖AI计算、3D图形衬着、物理仿真与科学计算,以及超高清视频编解码。”也就是说,“AI+3D图形+高机能计算”,摩尔线程在一颗芯片上同时做到了。

在首届开辟者大年夜会上,摩尔线程宣布了新一代全功能GPU架构花港,以及基于花港的AI训推一体芯片华山、专业图形图像计算芯片庐山、全新的AI SoC长江,以及进级的MUSA 5.0软件栈和AI BOOK。

显然,在摩尔线程的蓝图里,全功能GPU应用的宽度不仅知足传统应用的需求,更能捕获AI海潮中的各类机会,将立异潜力转化为可触达的实际价值。

近百个应用案例,让国产全功能GPU独特点更「具像化」

在1000平方米的展区里,最轻易被感知的,是图形才能。无论是《拳皇》如许的经典游戏,照样赛车、射击等高负载场景,GPU始终是玩家体验的核心。自2022年11月宣布花费级显卡MTT S80起,摩尔线程几乎每30天更新一次驱动,已实现对China Top 50热点游戏的100%兼容,并对个中44款完成专项优化。

首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

在视频与专业衬着场景中,GPU图形才能的价值被进一步放大年夜。摩尔线程的端侧及时视频超分技巧MTVSR,可实现2–4倍及时超分后果,同时降低视频存储和传输成本。在行业级场景中,基于摩尔线程MTT X300的国产视景体系——微视威eVTOL全动飞翔模仿器,已经由过程中公平易近航局5级剖断,初次打通全国产化视景衬着链路。

当全功能GPU的图形衬着与AI才能被同时调用,应用向更复杂的医疗、教导和工业场景延长。聪明医疗范畴,锦瑟医疗的篝火云平台基于MTT S4000,将AI推理、三维重建与高机能衬着整合在同一平台,将二维医学影像及时转化为三维模型,经由过程XR设备出现给大夫,成为手术过程中的“第三只眼”。

火热的智算场景中,摩尔线程经由过程KUAE集群的零中断容错筹划,实现大年夜范围练习全程不中断;在推理侧,与硅基流动对MTT S5000进行深度优化,在DeepSeek 671B全量模型的实际推理中,MTT S5000单卡Prefill吞吐冲破4000 tokens/s,Decode吞吐冲破1000 tokens/s,建立国产推理在低延迟和高吞吐的新标杆。

首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

热点的具身智能赛道,景业智能的VR遥操作机械人体系已与MTT E300 AI模组适配,并与MTT S80协同工作。操作者经由过程VR眼镜,即可在高风险情况中完成精细功课,让“人以遥操、机械代劳”成为实际。

首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

在更广阔的AI推理市场中,天思聪明、联达兴、全爱科技、紫光计算机等合作伙伴基于摩尔线程全功能GPU推出多款AI Box,将算力延长至具身智能、Agent、制造、办公、交通、教导和医疗等场景。

科学计算同样是全功能GPU优势的重要展示。摩尔线程结合北京大年夜学高毅勤课题组,基于国产SPONGE和DSDP软件,打造软硬件协同的生命科学解决筹划;硒钼科技的AI for Science(AI4S)平台也已完成对MTT S4000适配。在CAD、工业设计与专业可视化范畴,基于MTT S50与X300的国产工作站筹划正慢慢投入应用。

展区集中出现的近百个合作应用案例涵盖图形衬着、智能视频、AI计算与高机能计算,跨越云端与端侧,覆盖游戏、医疗、具身智能及AI4S等偏向。

摩尔线程能在短短五年就能展示出如斯多的应用,关键在于其一路疾走。

首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

下一代花港架构表态,华山和庐山新品解开机能束缚

摩尔线程自成立之初便选择全功能GPU路线,自2022年量产第一代架构苏堤以来,以一年一代的速度快速迭代。2023年宣布春晓架构,2024年量产曲院架构,2025年量产平湖架构。

首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

每代架构都推出知足不合市场需求的产品:苏堤架构的S10知足信创PC GPU国产化需求;春晓架构的S80和S3000,前者为国内游戏玩家首款国产花费级显卡,后者知足云桌面需求;曲院架构S4000为首个训推一体AI集成卡,在2024年组建千卡集群;平湖架构S5000构建万卡集群,支撑万亿参数大年夜模型练习。

2026年,摩尔线程将推出基于全新指令集的下一代架构——花港。张建中表示:“在国产工艺成长相对迟缓时,我们必须寻找更多办法晋升算力密度。经由过程全新指令集,将算力密度晋升50%,并经由过程精心打磨架构,将效能晋升10倍。

首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

计算精度优化:全精度端到端技巧,并特别优化FP8、FP6、FP4低精度单位以晋升能效;

  • 扩大才能加强:支撑十万卡以上计算集群,异步编程模型充分发挥每个算力单位机能,进步整体应用率;

  • 图形衬着进级:流水线从新改组,搭建新一代AI生成式衬着架构(AGR),衬着才能进一步晋升;第二代光线追踪加快引擎速度较上一代晋升5-6倍,完全支撑DirectX 12 Ultimate;

  • 安然性加强:供给四层安然防护,从安然域、信赖域、保护域到功能域,全方位守护信息安然。

  • 基于花港架构,摩尔线程推出两款新品:AI训推一体芯片华山和专业图形图像计算芯片庐山,为国产芯片机能打开新上限。

    华山是一款高机能AI推理与练习芯片,浮点计算机能位于业界最领先的两款GPU之间,访存带宽和高速互联同时晋升,结合异步编程技巧,实现高效线程同步、线程束特化和常驻核函数,综合机能极具竞争力。

    开源生态扩大年夜:筹划慢慢开源计算加快库、通信库及体系治理框架在内的核心组件,向开辟者社区开放深度优化的底层才能。

  • 华山在浩瀚特点中有两个尤为凸起,一个是新一代TensorCore不仅支撑从FP4到FP64的全精度计算,同时对FP8、FP6和FP4等低精度单位进行了优化,这是业界成长的偏向。

    还有开放支撑多种类的以太协定的特点。张建中表示,Scale-Up时,假如摩尔线程保持本身的MTLink路线,很多用户无法应用其他的Switch,所以华山不仅支撑MTLink 4.0,还支撑很多国内合作伙伴的以太网协定,充分兼容不合的硬件生态。

    首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

    首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

    庐山作为花港架构专业图形计算产品,比拟S80,游戏机能晋升15倍,AI计算机能晋升64倍,几何处理晋升16倍,光线追踪晋升50倍,明显加强纹理填充、原子访存才能及显存容量。3A游戏、CAD、CAE等场景均可胜任。

    首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

    首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

    无论华山照样庐山,在花港架构支撑下机能大年夜幅跃升,解建国产芯片机能束缚。这既得益于摩尔线程在全功能GPU路线上的持续迭代,也源于其技巧和专利积聚,截至2025年6月30日,公司累计授权专利514项,个中创造专利468项。

    要充分释放花港架构潜力,MUSA和开辟者成为关键。

    开放的MUSA生态,摩尔线程千亿价值的基石

    MUSA(Meta-computing Unified System Architecture)是摩尔线程自立研发的元计算同一体系架构,覆盖从芯片架构、指令集、编程模型到软件运行库及驱动法度榜样框架等的全栈技巧体系。

    首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

    得益于新一代Scale-up体系,今朝华山的才能可以或许实现1024个GPU的超节点。在此次开辟者大年夜会上,摩尔线程宣布了MTT C256超节点的架构筹划。

    为此,摩尔推出了搭载长江智能SoC的AIBOOK。新一代长江AI SoC集成CPU、GPU、NPU、VPU、DPU、DSP、ISP等单位,供给高达50TOPS端侧AI算力,内置1TB SSD、32G/64G高速存储,预装Linux内核AIOS体系及各类开辟对象,支撑主流操作体系,实现真正的“开箱即用”,成为开辟者在AI时代的超等个别。

    为了实现巨大年夜晋升,花港架构进行多项优化:

    • 郑纬平易近院士说,“以前是全球分工,如今讲主权AI。决定主权AI成败的关键,在于是否有足够多的开辟者愿意经久在这套栈上写代码。开辟者是生态的核心,不是厂家,厂家须要与开辟者一块尽力把生态做好。”

      这些案例并非零碎列举,而反复印证同一事实:同一架构下不合型号的全功能GPU可同时承担图形、AI与计算义务,其应用广度相较传统GPGPU出现出明显量级差别。

      首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

      若何才能把生态做好?北京智源人工智能研究院AI框架研发负责人敖玉龙说:“包涵和兼容,包涵意味着涵盖多条技巧路线;兼容意味着不必打造完全不合的生态。”

      摩尔线程恰是以此为思路构建MUSA生态。摩尔线程结合开创人、首席技巧官张钰勃说,“MUSA软件栈在编程模型、方法和加快库功能上与国际主流高度一致,最大年夜限度降低开辟者进修成本。但如许难以追赶国际主流,如何才能冲破?

      “有两个思路,一个是经由过程更高等抽象的DSL范畴专业编程说话,将底层立异精确发挥;另一个是与开辟者深度融合,实现软硬件协同设计1+1>2的后果。”张钰勃进一步表示。

      沿着这个思路 ,MUSA 5.0在全栈同一性、极致效能和生态开放性上取得关键冲破:

      • 编程生态进级:原生MUSA C,深度兼容 TileLang、Triton 等编程说话,为开辟者供给灵活高效的全栈开辟体验。

      • 计算效能优化:核心计算库muDNN实现GEMM/FlashAttention效力超98%,通信效力达97%,编译器机能晋升3倍,并集成高机能算子库,明显加快练习与推理全流程。

      • 前沿特点拓展:即将推出兼容跨代GPU指令架构的中心说话MTX、面向衬着+AI融合计算的编程说话muLang、量子计算融合框架MUSA-Q,以及计算光刻库muLitho,持续拓展全功能GPU的算力界线。

      首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

      MUSA 5.0作为连接开辟者和摩尔线程最重要的桥梁,也需好用的开辟平台。

      首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

      此外,基于长江SoC的迷你型计算设备MTT AICube也将推出,为开辟者供给更多选择。摩尔线程还将推出面向前沿范畴的完全筹划,如端云一体化具身智能筹划MT Robot,赞助开辟者缩短产品上市周期。

      首届开辟者大年夜会,让摩尔线程全功能GPU的独特优势更「具像化」

      今朝,摩尔学院用户总量已经达到了20万,这是阶段性成就,摩尔线程的目标是拥有百万级的MUSA开辟者。

      这并非幻想,全功能GPU已经决定了摩尔线程可以或许摸索的应用,包含图形衬着、AI与高机能计算,而MUSA生态的繁华程度,则决定了在各个市场的应用厚度和弗成替代性。广度与厚度的乘积,恰是支撑摩尔线程千亿价值的基石。

      从首届开辟者大年夜会的近百个应用案例,到MUSA生态与花港架构的落地,摩尔线程正以完全技巧体系和开放生态,将潜力转化为切实价值。雷峰网("大众,"号:雷峰网)

      雷峰网原创文章,未经授权禁止转载。详情见转载须知。

  • 点赞(0) 打赏

    评论列表 共有 0 条评论

    暂无评论

    微信小程序

    微信扫一扫体验

    立即
    投稿

    微信公众账号

    微信扫一扫加关注

    发表
    评论
    返回
    顶部