上科大年夜何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」 DA-DPO 不依赖额外标注,通过难度感知训练提升模型可靠性。 互联网 2026年01月17日 0 点赞 0 评论 234 浏览
清华刘洋团队论文:揭示为何 70B 的医疗模型,反而不如 8B 会问诊丨ILCR 2026 DOCTOR-R1:将临床问诊建模为 POMDP,用强化学习训练会动态提问的医疗智能体。 互联网 2026年02月26日 0 点赞 0 评论 185 浏览
清华大年夜学王智:工业大年夜模型「数据、算力、成本」三重门,我们若何体系破局?丨GAIR 2025 工业大模型的关键不在于“做得多大”,而在于是否能在真实产线的算力、成本与机理约束下稳定运行。 互联网 2025年12月19日 0 点赞 0 评论 274 浏览
清华孙茂松团队 × 深言科技:以解释作为练习旌旗灯号,让 8B 模型在幻觉检测上反超闭源大年夜模型 FaithLens 模型在忠实性幻觉检测任务上,达到了当前最优效果。 互联网 2026年01月15日 0 点赞 0 评论 219 浏览
之江实验室薛贵荣:当AI开端做科研,我看到了大年夜说话模型的天花板丨GAIR 2025 “大语言模型受限于「语言的边界」,无法理解高维度、跨模态的科学数据。 ” 互联网 2026年01月01日 0 点赞 0 评论 237 浏览
北大年夜林宙辰团队论文:从数据中自适应进修时序猜测损掉丨ICLR 2026 QDF:以极大似然估计为起点,结合元学习思想重构预测模型损失函数,实现跨模型泛化。 互联网 2026年02月13日 0 点赞 0 评论 114 浏览