Gemini、GPT-5.5、Claude-Opus、Gemini-Flash四款海外模型稳居前四,形成难以撼动的第一梯队。

性价比方面,国产模型优势凸起,多款产品进入高性价比区间,用更低成本实现接近头部的后果。推理效能上,海外模型仍垄断高效能区,国产模型多处在中低区间,还有晋升空间。
DeepSeek-V4-Pro、Qwen3.7-Max、豆包Seed 2.0 Pro三款国产模型分数异常接近,构成国内第一梯队,全球排名集中在第五位邻近,成为国产第一集团。
固然整体仍有差距,但国产模型进步很明显。代码生成项目中,Qwen3.7-Max得分仅次于海外头部模型,差距不到2分。数学推理、科学推理等项目,国产模型也多次冲进全球前列。
整体来看,国产大年夜模型正在快速追赶,但全球第一梯队的格局临时没变。


发表评论 取消回复