华为中国合作伙伴大年夜会 2026:技巧开放与才能共建,重塑伙伴合作新生态 面向NA市场,将进一步聚焦客户核心生产场景的智能化,强投入解难题,树立行业智能化灯塔。 互联网 2026年03月24日 0 点赞 0 评论 106 浏览
腾讯混元团队最新研究:让 AI 从「固定模型」走向「及时适配体系」 HY-WU :一种在推理阶段动态生成模型参数,而非依赖固定参数处理任务的方法。 互联网 2026年03月23日 0 点赞 0 评论 119 浏览
北大年夜林宙辰团队:从最优传输角度练习时序猜测模型 丨ICLR 2026 DistDF:从点对点误差转向联合分布对齐,重构时间序列预测的损失函数。 互联网 2026年02月27日 0 点赞 0 评论 255 浏览
清华刘洋团队论文:揭示为何 70B 的医疗模型,反而不如 8B 会问诊丨ILCR 2026 DOCTOR-R1:将临床问诊建模为 POMDP,用强化学习训练会动态提问的医疗智能体。 互联网 2026年02月26日 0 点赞 0 评论 184 浏览
腾讯混元 x MBZUAI 港中文新研究:将纠错纳入策略空间,Search-R2 重构搜刮加强推理进修方法 智能体性能优势并非来自更多尝试,而来自对失败路径的精确处理。 互联网 2026年02月13日 0 点赞 0 评论 142 浏览
北大年夜林宙辰团队论文:从数据中自适应进修时序猜测损掉丨ICLR 2026 QDF:以极大似然估计为起点,结合元学习思想重构预测模型损失函数,实现跨模型泛化。 互联网 2026年02月13日 0 点赞 0 评论 113 浏览
清华刘知远团队论文:在严格可控情况下从新答复「强化进修可否教会大年夜模型新才能」丨ICLR 2026 强化学习改变了模型组织技能的方式,而非简单提升指标。 互联网 2026年02月10日 0 点赞 0 评论 149 浏览