
据悉,本年以来,这已经不是DeepSeek第一次调剂价格。官方API文档显示,DeepSeek按百万tokens计费,并根据缓存射中、缓存未射中和输出tokens分别收费,同时DeepSeek V4系列本身对算力的请求也不低。
官方文档还显示,V4 Flash并发限制为2500;而V4 Pro这种高机能版模型并发限制为500,其供给弹性弱于Flash。
5月23日,DeepSeek宣布将此前的V4 Pro的75%优惠降价转为永远价格,API费用从此前最高24元/百万tokens降至最高6元/百万tokens。市场当时猜测,可能来自华为昇腾950芯片的供给增长有关,但DeepSeek并对此作出回应。
永远降价后,今朝V4 Pro的日常平凡价格为,缓存射中输入0.025元/百万tokens,缓存未射中输入3元/百万tokens,输出6元/百万tokens;V4 Flash的对应价格分别为0.02元、1元和2元。而到了岑岭时段,这些价格将翻倍,但依然比此前宣布时的价格低。
4月24日,DeepSeek宣布V4 Preview时就表示,V4 Pro为1.6万亿总参数、490亿激活参数,V4 Flash为2840亿总参数、130亿激活参数,两者均支撑100万tokens高低文。
对通俗用户而言,此次调剂未必会直接表现为聊天应用收费变更;重要受影响的是经由过程API接入DeepSeek模型的开辟者、AI应用公司和企业客户。
同样以V4 Pro为例,在计算输出tokens的情况下,若一家AI应用在岑岭时段天天消费1亿输出tokens,日常平凡成本约为600元,岑岭价下约为1200元;若天天消费10亿输出tokens,成本则由约6000元升至1.2万元。对于客服、代码助手、办公Agent、搜刮加强问答等高频应用,价格翻倍可能会直接影响毛利率和调用策略。
今朝,DeepSeek引入峰谷时订价并非放弃低价路线。更精确地说,DeepSeek只是把算力资本按应用时段从新分层,使其低价策略开端从同一便宜变成精细化便宜。
“涨价”前的“永远降价”
因为仅从tokens的订价看,DeepSeek在引入峰谷时之后仍处于低价的“真喷鼻”区间,放在国际市场依然异常具有竞争力,这也是DeepSeek涨价的底气。
根据DeepSeek英文API价格页显示,V4 Pro输出价格为0.87美元/百万tokens,按岑岭翻倍测算约为1.74美元。比拟之下,OpenAI官方价格页显示,GPT-5.5标准API价格为输入5美元、缓存输入0.5美元、输出30美元/百万tokens;Anthropic的Claude Opus 4.8惯例价格为输入5美元、输出25美元/百万tokens。
若仅看输出tokens,OpenAI和Anthropic高端模型价格仍约为DeepSeek V4 Pro峰市价的14—17倍。

并非放弃低价路线
另一方面,跟着海外市场大年夜模型订价模式从固定订阅转向按tokens计费,企业的应用成本开端巨大年夜攀升,很多预算有限的海外企业,正把更多调用转向DeepSeek等低成本模型。
据此前报道,以打车软件Uber为例,因为大年夜模型订价模式改变后,仅仅4个月就敏捷消费了公司全年的AI预算,导致不得不限制高管应用,有幸成为“第一个叫停AI烧钱的大年夜厂”。
而微软、Coinbase等公司的高管也开端强调,很多企业义务并不总须要最昂贵、最大年夜的模型。这些变更都推动企业更多采取“多模型路由”,即把简单义务交给便宜模型,复杂义务再交给高端模型。
是以,OpenRouter的数据显示,开源模型已承担其平台上约65%的token处理量,个中以DeepSeek为代表的中国低成本模型的应用量,已明显上升,直不雅反应出海外用户已进入“精打细算”时代。

发表评论 取消回复