清华刘知远团队论文:在严格可控情况下从新答复「强化进修可否教会大年夜模型新才能」丨ICLR 2026 强化学习改变了模型组织技能的方式,而非简单提升指标。 互联网 2026年02月10日 0 点赞 0 评论 57 浏览
清华刘知远团队论文:最小化构造修改,短文本到长文本丝滑进级 | ICLR 2026 InfLLM-V2:通过最小结构扰动,实现大模型从短上下文到长上下文的平滑升级。 互联网 2026年02月10日 0 点赞 0 评论 59 浏览