格灵深瞳宣布大年夜范围中文视觉说话预练习数据集:丹青 格灵深瞳发布大规模中文视觉语言预训练数据集“丹青”(DanQing),包含1亿组图文配对数据,基于2024–2025年网络数据构建。该数据集采用更严格的筛选机制,研究团队基于SigLIP2模型实验表明,其在零样本分类、跨... 互联网 2026年01月20日 0 点赞 0 评论 94 浏览
格灵深瞳宣布大年夜范围中文视觉说话预练习数据集:丹青 格灵深瞳发布大规模中文视觉语言预训练数据集“丹青”(DanQing),包含1亿组图文配对数据,基于2024–2025年网络数据构建。该数据集采用更严格的筛选机制,研究团队基于SigLIP2模型实验表明,其在零样本分类、跨... 互联网 2026年01月20日 0 点赞 0 评论 142 浏览