在国内的Linux.do社区中,也有多位网友谈到了Opus 4.6降智的问题,还用两个很出名的AI大年夜模型测试问题做了验证。
这两个题一个是50米距离去洗车到底是要开车照样走路以前,一个是父亲因女儿红绿色盲而崩溃的,本质上都是逻辑陷阱,但很能考验AI的才能。
之前大年夜把国表里AI在洗车问题上翻车,Claude的大年夜模型是少有的能答复对的大年夜模型之一,智商优势明显。
也有网友贴图本身的测试,表示能答对,是以这个问题也不是完全一边倒的。
结合之前AMD的吐槽来看,近期Cluade的降智显然是存在的,只是降智的原因不好说,Anthropic公司的高管之前是不承认存在问题的。
比较合理的猜测照样跟算力有关,前几天马斯克的问题中无意中泄漏了Claude的Sonnet 4.6是1万亿参数量的大年夜模型,Opus 4.6则是5万亿参数量的,并且还不是MoE类型的,稠密模型对算力的请求很高,成本昂扬,所以收费价格也是最贵的。
如今的AI公司卖订阅照样亏钱的,这也能部分化释Anthropic为何要封杀小龙虾这种超高Token消费的应用的念头。
对国内开辟者来说,还有一种降智的原因,那就是Anthropic会根据IP来定向降智,本质上也是分派算力的问题,然则以搞针对性IP/国度的方法,这种事也不止他们一家这么做,OpenAI等其他美国公司也被发明过用这种手段限制国内的开辟者和用户。
然而如今的实测下来,哪怕是最强大年夜的Opus 4.6大年夜模型,在这两个问题上也开端答复纰谬了,没有了之前的高智商才能。



发表评论 取消回复