DeepSeek团队近日宣布论文提出了名为mHC(流形束缚超连接)的新收集架构,旨在解决传统架构在大年夜范围模型练习中的不稳定性问题,这一研究或将为下一代基本架构的演进指明新偏向。

新论文名为《mHC :Manifold-Constrained Hyper-Connections》(《mHC:流形束缚超连接 》),DeepSeek开创人兼CEO梁文锋涌如今了合有名单之中,而解振达(Zhenda Xie)、韦毅轩(Yixuan Wei)、曹焕琪(Huanqi Cao)则是核心供献者。

论文地址:https://www.arxiv.org/abs/2512.24880

根据介绍,该框架旨在晋升可扩大性,同时降低练习先辈人工智能体系的算力和能源需求。DeepSeek下一代旗舰体系R2估计将在2月份春节前后问世。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部