Anthropic的推文(图源:X平台)

不过,Anthropic的指控一经宣布,就遭到了一边倒的质疑。有人认为Anthropic自身的数据来源就已经存疑,没有立场质疑他人,也有人认为,若相干中国公司确切经由过程API和账户付费调用模型接口,那么其行动至少在情势上属于“合理应用产品”。换言之,蒸馏违法与否应当由司法界定,而非试图用舆论先行定性。


OpenRouter周榜中,中国模型占据了调用量前五名中的四席(图源:OpenRouter)

不少AI圈人士下场批驳Anthropic,吐槽了Anthropic”只许明知故犯,不许庶平易近点灯”的双标行动。马斯克第一时光反讽道:“绝了,他们(DeepSeek们)怎么敢偷Anthropic从人类法度榜样员那边‘偷’来的器械?”


马斯克的推文(图源:X平台)

马斯克进一步弥补道:“Anthropic已经犯有大年夜范围窃取练习数据的罪恶,他们必须为其偷盗行动付出数十亿美元的补偿金。这就是事实。

网友质疑Anthropic念头(图源:X平台)

马斯克的推文(图源:X平台)


Garry Marcus吐槽Anthropic(图源:X平台)

还有网友锐评道:“Anthropic不也是爬取了全部互联网的数据,并打破了无数的办事条目吗?

网友分析蒸馏行动的合法性问题(图源:X平台)


网友吐槽Anthropic(图源:X平台)

有人则质疑起了Anthropic的念头。下图中的这位网友分析道,很多AI模型都是应用竞争敌手的数据构建的,这在业内是一个公开的机密。而Anthropic在此时采取了一个异常平易近族主义的立场,把这些行动贴标签,称之为“外国实验室”的“进击”,意图可能是推动美国当局对跨境AI数据拜访和共享,进行更严格的监管办法。


因为Anthropic的模型是闭源的,而三家中国AI公司的模型根本是开源的,是以甚至有网友认为,就算蒸馏行动切实其实存在,他们也支撑这种行动,因为业界须要更强的Deepseek V4, Kimi K3和Minimax M3,没有效户会为Anthropic哭泣。



Anthropic在博客中强调,DeepSeek、MiniMax和月之暗面的蒸馏范围“须要先辈芯片支撑”,并进一步提出蒸馏进击“强化了出口管束的合理性”,限制芯片获取不仅能限制直接模型练习,也能限制所谓“不法蒸馏”的范围。这一谈吐与Anthropic历来在对华议题上偏鹰派的立场一致。

01.

Anthropic曝光所谓“蒸馏进击”

在博客中,Anthropic坦言,蒸馏本身是一种广泛应用且合法的技巧,很多前沿实验室都邑用更强大年夜的模型练习体量更小、成本更低的模型版本。

声称已加强检测与防御机制

但这项技巧也可以被用于争议性用处:竞争敌手可以用它在更短的时光和成本下,从其他AI实验室获得强大年夜的才能,这远低于自力开辟所需的才能。

Anthropic认为,“不法蒸馏”获得的模型往往不会持续原模型内置的安然防护机制,这意味着本来被限制用于生物兵器开辟、恶意收集进击或其他高风险用处的才能,可能在缺乏束缚的情况下扩散,从而带来安然风险。

有名AI评论家Gary Marcus认为,Anthropic的行动是“肆无顾忌的响马抱怨本身被掳掠了”。

Anthropic具体描述了他们眼中DeepSeek、MiniMax和月之暗面的所谓“蒸馏进击”行动。

这三家中国公司用Claude批量生成推理链、对象调用、编程与数据分析等练习数据,或是让Claude成为强化进修的嘉奖模型。为获取这些数据,DeepSeek进行了大年夜约15万次交互、月之暗面进行了跨越340万次交互,而MiniMax进行了跨越1300万次交互。


Anthropic博客中关于三家中国AI企业应用方法的描述(图源:Anthropic官网)

三家AI实验室的操作模式具有类似特点:应用所谓“讹诈账户”,绕过区域限制,同时规避侦测。提示词的数量、构造和重点与正常应用模式不合,更像是在有意地提取模型才能而非合法应用。

网友一边倒质疑Anthropic(图源:X平台)

针对这些现象,Anthropic称已加强检测与防御机制,包含建立流量模式辨认与行动指纹体系、辨认思维链数据提取行动、加强账户验证流程,并与其他AI公司、云办事商及相干机构共享技巧谍报。

同时,Anthropic也在开辟产品与模型层面的反蒸馏技巧,在不影响正常用户体验的前提下,降低模型输出被用于不法练习的价值。

该公司还将蒸馏进击与出口管束接洽起来。Anthropic称,美国对先辈AI芯片与相干技巧实施出口管束,旨在保持技巧领先优势,但大年夜范围蒸馏可能在必定程度上减弱这一优势,使部分实验室可以或许经由过程“提取才能”而非自立研发来缩小差距。

02.

Anthropic一家之言遭围攻

立场到数据隐私皆被质疑

不过,须要强调的是,上述谈吐今朝只是Anthropic的一家之言。模型蒸馏平日指的是有意调用某个教师模型,大年夜范围获取其输出,并用来体系性练习另一个模型,以切近亲近其才能。

Anthropic今朝披露的信息中,并没有中国公司实施上述行动的直接证据或原始数据支撑。

在上述背景之下,环绕相干指控的真实性、司法界线以及企业念头的评论辩论敏捷升温。舆论场几乎出现出一边倒的态势,大年夜部分网友对Anthropic的谈吐并不买账。

起首,Anthropic选择在X平台发文,而非诉诸司法,这在不少网友眼中就有些可疑。

这位网友便认为,与其应用公司影响力来声称个别订户“滥用”办事并威逼美国的创意成果,Anthropic更应当做的是将本身的司法和安然资本转向解决这些大年夜范围的体系性进击。


网友吐槽Anthropic(图源:X平台)

有位网友给出了本身对上述现象的分析:蒸馏实际上并不违法,即便就算是违法行动,那么Claude也是不法构造的。这就是为什么Anthropic在向当局抱怨这一问题,而不是直接告状。


网友分析蒸馏行动的合法性问题(图源:X平台)

另一位网友认为,合法蒸馏应用的存在,让监督工作变得更难,因为证实企业应用模型的意图和范围,要比传统的版权索赔复杂得多。


Anthropic的举措在部分网友眼中并不但彩。这位网友就认为,Anthropic这一套“请不要向我们的竞争敌手出口GPU”的谈吐,听起来就像是他们想实现某种垄断。


网友质疑Anthropic试图实现垄断(图源:X平台)

Anthropic还在其官方博客中披露了一项重要细节:经由过程分析请求元数据,他们可以或许将特定的对话记录直接追溯到月之暗面和DeepSeek的具体员工,等于顺着网线一路精准锁定真人。这一做法随即激发了外界对数据安然与隐私保护问题的担心。

一位来自欧洲的用户称,Anthropic的这番谈吐,似乎正在吹捧本身能应用元数据,实现用户的去匿名化,“难道这就是Anthropic如今的隐私政策吗”?


网友质疑Anthropic的数据安然问题(图源:X平台)

今朝,DeepSeek、月之暗面和MiniMax均尚未对Anthropic的本次指控做出公开回应。

Anthropic将蒸馏行动称为“蒸馏进击”,这一说法本质上也有些“文字游戏”的嫌疑。多位Reddit网友认为,即便其他公司确切应用其产品生成的数据进行练习,这本质上也只是用户在正常应用产品,并且这些用户是付了费的。

有评论戏谑道,按照Anthropic这套逻辑,就比如你去餐厅吃饭,记住了厨师做出来的味道,然后回家本身做了顿饭,就被扣上了“不法进行蒸馏进击”的帽子。



Reddit网友吐槽Anthropic的文字游戏(图源:X平台)

03.

被质疑蒸馏不是新鲜事

DeepSeek、月之暗面此前已有正面回应

不过,对于中国模型蒸馏海外模型的质疑,自2025年DeepSeek进入全球主流视野以来就一向没有中断过。而这些中国企业此前已经在不合的场合,回应过相干质疑。

比如,DeepSeek就曾遭到OpenAI质疑,称其模型蒸馏自OpenAI的模型。

作为回应,DeepSeek在客岁9月登上Nature杂志封面的DeepSeek-R1论文中弥补道,DeepSeek-V3 Base(DeepSeek-R1的基座模型)应用的数据全部来自互联网,固然可能包含GPT-4生成的成果,但绝非有意而为之,更没有专门的蒸馏环节。

值得留意的是,Anthropic提出相干指控的机会,正值美国评论辩论放松对华AI芯片出口和中国模型在海外热度攀升之际。MiniMax M2.5和Kimi K2.5近期都一度成为大年夜模型调用平台OpenRouter上应用量最大年夜的模型,并在海外开辟者群体中获得了高性价比、才能出色的优胜口碑,而DeepSeek尚未宣布的V4,则吊足了全球网友的胃口。

而本年1月,月之暗面也曾回应外界对Kimi K2.5的蒸馏质疑。

当时,有部分网友发明Kimi K2.5有时会自称为Claude,困惑这是对Claude进行蒸馏的证据。杨植麟回应道,这一现象主如果由在预练习阶段对最新编程数据进行了上采样,而这些数据似乎与“Claude”这个token的接洽关系性较强。事实上,K2.5在很多基准测试中似乎都优于Claude。

那么,为什么Claude生成的数据会“误打误撞”融入中国企业的模型呢?

今朝的大年夜模型练习,高度依附公开互联网数据。像Anthropic推出的Claude以及Claude Code,被全球开辟者广泛用于写代码、生成文档、提交开源项目。

当开辟者把这些生成内容宣布到GitHub、博客或技巧论坛后,这些内容就进入了公共互联网语料池。而很多模型在练习时会抓取公开网页数据,是以个中一部分天然会包含由Claude生成的代码或文本。这是一种间接扩散路径,可能涌如今任何模型身上,激发模型的“自我认知”问题。Anthropic自家的模型Claude Sonnet 4.6,也曾出现自称为DeepSeek的情况。

Claude Sonnet 4.6自称DeepSeek

Claude Sonnet 4.6自称DeepSeek

有不少海外技巧圈人士也存眷到了这一现象。AI练习平台Prime Intellect的工程师Will Brown提出了大年夜量问题。比如,应用Claude供献的开源GitHub代码练习模型,算不算蒸馏?把Claude的数据公开分享到互联网上,违不违背用户协定?用Claude Code写练习代码,用于练习竞对模型,违不违背用户协定?

Will Brown对Anthropic提出连续串疑问(图源:X平台)

Will Brown对Anthropic提出连续串疑问(图源:X平台)

假如上述问题的谜底都是“是”,那么正如另一位网友所说的,根据Anthropic的条目,在AI圈里,因为Anthropic和所有企业都有竞争关系,那么理论上只有Anthropic本身可以应用Claude,其他企业都不克不及用。

另一位网友认为,所谓的“不法蒸馏”和“正常互联网活动”的界线并不清楚,如今Anthropic真正须要做的是精确界定,然后推动监管。

网友提出该范畴存在监管空白(图源:X平台)

网友提出该范畴存在监管空白(图源:X平台)

04.

结语:争议背后的家当博弈

从家当竞争角度看,当前全球大年夜模型才能正在快速收敛。中国AI公司在算力受限的情况下,经由过程算法优化、工程才能晋升和数据应用效力改进来追赶国际前沿,走出独特的技巧立异路径。将所有才能晋升都归因于“蒸馏提取”,大年夜幅度贬低了中国AI实验室的研发投入与工程进展。

当然,假如确切存在违背办事条目、应用虚假账户等行动,平台方采取技巧封禁和风控办法属于正常贸易行动。但将其上升为国度安然威逼,甚至作为强化出口管束的论据,则已经超出单一企业胶葛的范围。对我们而言,与其简单接收某一方的定性,不如保持谨慎立场,沉着对待其背后的家当博弈逻辑。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部