腾讯混元 x MBZUAI 港中文新研究:将纠错纳入策略空间,Search-R2 重构搜刮加强推理进修方法 智能体性能优势并非来自更多尝试,而来自对失败路径的精确处理。 互联网 2026年02月13日 0 点赞 0 评论 71 浏览
微分智飞高飞:我们正处于通用飞翔智能爆发前夕丨GAIR 2025 “我们想要 answer back 黄仁勋那句「只有三种机器人可以大规模量产,人形机器人、无人机和汽车」。 ” 互联网 2025年12月31日 0 点赞 0 评论 142 浏览
清华刘知远团队论文:在严格可控情况下从新答复「强化进修可否教会大年夜模型新才能」丨ICLR 2026 强化学习改变了模型组织技能的方式,而非简单提升指标。 互联网 2026年02月10日 0 点赞 0 评论 87 浏览
计算所严肃玉团队新作: Attention 并非永远是瓶颈,多 GPU 并不必定更快 系统实验表明,模型推理分为计算受限的 Prefill 与内存受限的 Decode。 互联网 2025年12月30日 0 点赞 0 评论 118 浏览
南边科技大年夜学张进传授:为什么打造空间智能,不克不及只依附“传统多模态感知”?|GAIR 2025 以声波毫米波为代表的新型模态感知,正在重塑空间智能。 互联网 2026年01月09日 0 点赞 0 评论 89 浏览