港大年夜赵恒爽团队论文:让扩散模型既拿高分又不「作弊」丨CVPR 2026 GDRO:一种通过组级奖励排序优化扩散模型生成能力的后训练方法。 互联网 2026年03月23日 0 点赞 0 评论 10 浏览