在腾讯内部,姚顺雨请求团队不要以打榜为导向。
作为梁文锋打磨已久的多模态大年夜模型,DeepSeek V4 除了代码才能跃升,还会在经久记忆上取得冲破。

OpenRouter 页面显示,Healer Alpha 被描述为具备视觉、听觉、推理与行动才能的前沿全模态模型;

社区是以敏捷将其与尚未宣布的新一代国产模型接洽起来,据称捕获到了“体系提示词中请求严格遵守中国司法律例”。

https://x.com/chetaslua/status/2031983459057672455
另一个已被公开验证的实际是,DeepSeek 的产品声量已经举高了市场预期。
而就在 3 月 12 日,据《白鲸实验室》独家爆料(独家|梁文锋将携DeepSeek V4撞上姚顺雨):
这一偏向与 DeepSeek 团队近几个月的公开研究脉络根本一致。
2026 年 1 月,梁文锋签名论文《Conditional Memory via Scalable Lookup》提出“前提记忆”机制;
2025 年 12 月的《mHC: Manifold-Constrained Hyper-Connections》则持续指向底层架构优化。
两篇论文都在测验测验处理 Transformer 在记忆、练习稳定性和长高低文上的瓶颈。
据《白鲸实验室》独家爆料(独家|梁文锋将携DeepSeek V4撞上姚顺雨):
梁文锋以前半年的重要工作,是补齐 DeepSeek 在视觉内容处理和 AI 搜刮上的短板。
梁文锋此次为 DeepSeek V4 设定的关键迭代偏向,恰是经久记忆才能。
为强化 AI 搜刮才能,DeepSeek 早在客岁就已与百度展开合作。
DeepSeek V4 还将深度适配国产芯片,并有望成为首个完全跑在国产算力生态上的大年夜模型。
DeepSeek App 上线至 2025 年 2 月 9 日,累计下载量已跨越 1.1 亿次,周活泼用户范围最高接近 9700 万。
姚顺雨的全新混元模型
也筹划于 4 月宣布
DeepSeek 之外,腾讯也在为 4 月预备新动作。
姚顺雨已于 2025 年 12 月出任腾讯总办首席 AI 科学家,同时兼任 AI Infra 部和大年夜说话模型部负责人;

2026 年 2 月,签名包含姚顺雨的论文 CL-bench 宣布,提出一套面向“高低文进修”的新评测基准,持续把腾讯混元的研究核心推向长高低文与 Agent 可用性。

https://arxiv.org/abs/2602.03587
据《白鲸实验室》独家爆料(独家|梁文锋将携DeepSeek V4撞上姚顺雨):
姚顺雨也将在 4 月宣布新的混元模型,范围约为 30B 参数。
早在 2025 岁首年代,姚顺雨就已接收邀请回国;实际上,姚顺雨对新模型的预备早已开端,而不是只有官宣后的不到半年时光。
本年 1 月末,《晚点LatePost》也已爆料(字节、阿里、腾讯 AI 大年夜战全记录:一场影响命运的战斗):

DeepSeek V4 将于 4 月正式上线。
从公开轨迹看,4 月这一轮更新不会只是一次参数比赛。
DeepSeek 的已知研究正向经久记忆、多模态和底层架构延长,腾讯混元则在高低文进修和真实义务评测上加快补课。
两条路线很不一样,但都在试图答复同一个问题:下一个阶段的大年夜模型,毕竟该如何真正走进临盆情况。

发表评论 取消回复