走路洗车、红绿色盲等问题都答纰谬网友吐槽最强编程AI降智严重

215 阅读 0 评论 0 点赞

在国内的Linux.do社区中，也有多位网友谈到了Opus 4.6降智的问题，还用两个很出名的AI大年夜模型测试问题做了验证。

这两个题一个是50米距离去洗车到底是要开车照样走路以前，一个是父亲因女儿红绿色盲而崩溃的，本质上都是逻辑陷阱，但很能考验AI的才能。

之前大年夜把国表里AI在洗车问题上翻车，Claude的大年夜模型是少有的能答复对的大年夜模型之一，智商优势明显。

也有网友贴图本身的测试，表示能答对，是以这个问题也不是完全一边倒的。

结合之前AMD的吐槽来看，近期Cluade的降智显然是存在的，只是降智的原因不好说，Anthropic公司的高管之前是不承认存在问题的。

比较合理的猜测照样跟算力有关，前几天马斯克的问题中无意中泄漏了Claude的Sonnet 4.6是1万亿参数量的大年夜模型，Opus 4.6则是5万亿参数量的，并且还不是MoE类型的，稠密模型对算力的请求很高，成本昂扬，所以收费价格也是最贵的。

如今的AI公司卖订阅照样亏钱的，这也能部分化释Anthropic为何要封杀小龙虾这种超高Token消费的应用的念头。

对国内开辟者来说，还有一种降智的原因，那就是Anthropic会根据IP来定向降智，本质上也是分派算力的问题，然则以搞针对性IP/国度的方法，这种事也不止他们一家这么做，OpenAI等其他美国公司也被发明过用这种手段限制国内的开辟者和用户。

然而如今的实测下来，哪怕是最强大年夜的Opus 4.6大年夜模型，在这两个问题上也开端答复纰谬了，没有了之前的高智商才能。

点赞(0) 打赏

暂无评论

走路洗车、红绿色盲等问题都答纰谬 网友吐槽最强编程AI降智严重