DeepSeek团队近日宣布论文提出了名为mHC(流形束缚超连接)的新收集架构,旨在解决传统架构在大年夜范围模型练习中的不稳定性问题,这一研究或将为下一代基本架构的演进指明新偏向。

新论文名为《mHC :Manifold-Constrained Hyper-Connections》(《mHC:流形束缚超连接 》),DeepSeek开创人兼CEO梁文锋涌如今了合有名单之中,而解振达(Zhenda Xie)、韦毅轩(Yixuan Wei)、曹焕琪(Huanqi Cao)则是核心供献者。
论文地址:https://www.arxiv.org/abs/2512.24880
根据介绍,该框架旨在晋升可扩大性,同时降低练习先辈人工智能体系的算力和能源需求。DeepSeek下一代旗舰体系R2估计将在2月份春节前后问世。

发表评论 取消回复