上科大年夜何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」 DA-DPO 不依赖额外标注,通过难度感知训练提升模型可靠性。 互联网 2026年01月17日 0 点赞 0 评论 116 浏览