AI
北大年夜林宙辰团队:从最优传输角度练习时序猜测模型 丨ICLR 2026
DistDF:从点对点误差转向联合分布对齐,重构时间序列预测的损失函数。
清华刘洋团队论文:揭示为何 70B 的医疗模型,反而不如 8B 会问诊丨ILCR 2026
DOCTOR-R1:将临床问诊建模为 POMDP,用强化学习训练会动态提问的医疗智能体。
腾讯混元 x MBZUAI 港中文新研究:将纠错纳入策略空间,Search-R2 重构搜刮加强推理进修方法
智能体性能优势并非来自更多尝试,而来自对失败路径的精确处理。
北大年夜林宙辰团队论文:从数据中自适应进修时序猜测损掉丨ICLR 2026
QDF:以极大似然估计为起点,结合元学习思想重构预测模型损失函数,实现跨模型泛化。
清华刘知远团队论文:在严格可控情况下从新答复「强化进修可否教会大年夜模型新才能」丨ICLR 2026
强化学习改变了模型组织技能的方式,而非简单提升指标。
万联易杀青立家当人工智能研究与应用专家委员会,实现产研双向奔赴
当AI从技术概念迈入价值兑现的“深水区”,产研如何深度携手,通力共现产业AI化、技术商业化的价值闭环?
