上科大年夜何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」 DA-DPO 不依赖额外标注,通过难度感知训练提升模型可靠性。 互联网 2026年01月17日 0 点赞 0 评论 152 浏览
清华刘洋团队论文:揭示为何 70B 的医疗模型,反而不如 8B 会问诊丨ILCR 2026 DOCTOR-R1:将临床问诊建模为 POMDP,用强化学习训练会动态提问的医疗智能体。 互联网 2026年02月26日 0 点赞 0 评论 76 浏览
清华大年夜学王智:工业大年夜模型「数据、算力、成本」三重门,我们若何体系破局?丨GAIR 2025 工业大模型的关键不在于“做得多大”,而在于是否能在真实产线的算力、成本与机理约束下稳定运行。 互联网 2025年12月19日 0 点赞 0 评论 202 浏览
清华孙茂松团队 × 深言科技:以解释作为练习旌旗灯号,让 8B 模型在幻觉检测上反超闭源大年夜模型 FaithLens 模型在忠实性幻觉检测任务上,达到了当前最优效果。 互联网 2026年01月15日 0 点赞 0 评论 162 浏览
AI算力新十年:技巧改革、生态协同与贸易闭环,共探“下一个寒武纪”之路 | GAIR 2025 在算力成为基础设施的时代,究竟什么样的技术路径、生态战略和商业逻辑,能够穿越周期,占据未来价值链的顶端? 互联网 2025年12月19日 0 点赞 0 评论 172 浏览
之江实验室薛贵荣:当AI开端做科研,我看到了大年夜说话模型的天花板丨GAIR 2025 “大语言模型受限于「语言的边界」,无法理解高维度、跨模态的科学数据。 ” 互联网 2026年01月01日 0 点赞 0 评论 177 浏览
北大年夜林宙辰团队论文:从数据中自适应进修时序猜测损掉丨ICLR 2026 QDF:以极大似然估计为起点,结合元学习思想重构预测模型损失函数,实现跨模型泛化。 互联网 2026年02月13日 0 点赞 0 评论 37 浏览