
“所有人都在谈论石油,但我认为全球真正缺乏的是Token。”洛杉矶工程师兼科技投资者Ben Pouladian表示。Token是AI顶用于衡量义务消费算力的计量单位。“如今的AI早已不只是我们站在冰箱前问菜谱的聊天机械人,它在兼顾义务,变得越来越智能。”
这一切都指向了科技繁华史上反复出现的经典问题:从19世纪铁路扩大到21世纪初电信与互联网爆发,需求增速始终远超企业获取资本、搭建基本举措措施的速度。汗青上,涨价往往是解决供给紧缺的独一手段,但此举对前沿AI公司而言风险巨大年夜——它们正为争夺用户展开激烈竞争。
用于练习和运行AI模型的图形处理器(GPU)时租价格自客岁秋季以来大年夜幅飙升。热点聊天机械人Claude及其爆红的编程对象Claude Code的开辟公司Anthropic近期频繁遭受办事中断。该公司已开端在岑岭时段对用户实施Token用量限制,但这一办法激发大年夜量用户抱怨,称本身很快就触达用量上限。
据报道,OpenAI叫停其视频生成应用Sora,部分原因就是腾出算力,以支撑代号为Spud的全新AI模型驱动的编程与企业级产品。
OpenAI面向企业用户的API平台Token用量从客岁10月的每分钟60亿飙升至3月下旬的150亿。
客岁事尾,范围最大年夜的上市AI云计算公司之一CoreWeave将价格上调逾20%,并请求小型客户签订至少三年的办事合约,此前这一刻日仅为一年。美国银行分析师上月末恢复对该公司的评级并赐与“买入”评级,称其办事需求至少在2029年前都将持续供不该求。
“我确切花了大年夜量时光寻找一切能临时调用的算力。”OpenAI首席财务官萨拉・弗莱尔在近期一次面向投资者的公开视频采访中表示,“因为算力不足,我们眼下正被迫放弃一些项目,做出异常艰苦的弃取。”
纽约数据供给商Ornn的数据显示,近几个月来,英伟达全系列GPU在云端数据中间的现货租赁价格均大年夜幅上涨。Ornn Compute价格指数显示,英伟达最先辈的Blackwell系列芯片单小时房钱已达4.08美元,较两个月前的2.75美元上涨48%。
自2月中旬以来,Anthropic全体系频繁宕机,部分企业客户已转而应用其他AI厂商的模型。
软件开辟平台Retool开创人兼首席履行官David Hsu表示,他本来更偏向应用Anthropic的Opus 4.6模型驱动公司的AI智能体对象,因为他认为这是最合适企业场景的模型。但他近期已切换至OpenAI的模型。“Anthropic的办事一向在频繁中断。”
互联网核心办事的靠得住性平日用“几个九”衡量,四个九即99.99%的在线率,也是软件公司对客户的常见承诺。截至4月8日,Anthropic的Claude API近90天在线率仅为98.95%。
以前几个月,“智能体AI”需求出现爆发式增长。这类自立型AI对象能自力完成各类义务,从编写软件代码到为房产经纪人安排看房行程。企业正争相抢占算力资本,以办事赓续扩大年夜且应用强度明显晋升的用户群体。
“这很不正常。”AI推理始创公司Baseten结合开创人兼首席技巧官Amir Haghighat表示,“想想AWS、数据库、RDS或Stripe,它们都须要极高的稳定性和在线率。但AI范畴今朝并非如斯,这不是你欲望从为应用供给智能才能的公司那边获得的办事质量。”
在办事频繁中断的同时,Anthropic正经历爆发式增长。2025岁终,该公司年度营收年化范围达90亿美元;到本年2月,这一数字飙升至140亿美元;两个月后再度翻倍,达到300亿美元。
3月下旬,Anthropic忽然宣布,将在宁靖洋时光工作日早5点至11点的岑岭时段限制用户Token消费额度。用户纷纷在社交平台抱怨。一位用户在X上写道:“我好几周都没触达Claude Code限额,成果这周45分钟就用完了。”
“我们正全力知足Claude日益增长的需求。”Claude Code负责人兼开辟者鲍里斯・切尔尼在X上表示,“算力是我们谨慎治理的资本,我们会优先保障应用产品与API的客户。”

发表评论 取消回复