GPT-5.4 nano则定位成本最低、延迟最短的轻量选项,仅经由过程API向开辟者开放,专为数据分类、提取及简单编程子义务设计。


两款模型的推出,意在弥补大年夜模型在及时交互场景中因延迟过高而难以落地的空白,直接影响覆盖编程助手、AI代理体系及多模态应用等快速增长的贸易市场。

mini面向花费端,nano专属API

GPT-5.4 mini今日起在OpenAI API、Codex平台及ChatGPT三大年夜渠道同步上线。

GPT-5.4 mini的API订价为每百万输入token 0.75美元、每百万输出token 4.50美元,支撑文本与图像输入、对象调用、函数调用、网页搜刮、文件检索、计算机操控及技能扩大,高低文窗口达40万token。

在Codex平台,GPT-5.4 mini仅消费GPT-5.4配额的30%,开辟者处理简单编程义务的成本约降至旗舰模型的三分之一。Codex还支撑将工作量委派给以GPT-5.4 mini运行的子智能体,使推理密度较低的义务主动落入更便宜的模型。

在ChatGPT端,Free与Go用户可经由过程"+"菜单选择"Thinking"功能应用GPT-5.4 mini;其余付费用户在GPT-5.4 Thinking触达速度上限后,该模型将作为主动降级备选项启用。

GPT-5.4 nano今朝仅经由过程API供开辟者调用,订价为每百万输入token 0.20美元、每百万输出token 1.25美元,为两款新模型中订价最低者。OpenAI表示,nano合适由高阶模型兼顾调剂、负责处理次要支撑义务的子智能体场景。



从OpenAI颁布的评测数据来看,GPT-5.4 mini在编程及多模态义务上的表示尤为凸起。

在编程基准SWE-bench Pro上,mini得分54.4%,与GPT-5.4的57.7%差距收窄至3.3个百分点,远高于GPT-5 mini的45.7%。

mini切近亲近旗舰,nano超出前代


在计算机操控基准OSWorld-Verified上,mini以72.1%切近亲近GPT-5.4的75.0%,并大年夜幅领先GPT-5 mini的42.0%。


对象调用才能方面,GPT-5.4 mini在τ2-bench电信测试中得分93.4%,较GPT-5 mini的74.1%晋升明显。在通用智能测试GPQA Diamond中,mini得分88.0%,nano亦达82.8%,均超出GPT-5 mini的81.6%。

值得存眷的是,GPT-5.4 nano在部分视觉义务中表示落后于GPT-5 mini,OSWorld-Verified得分39.0%低于后者的42.0%。但在编程及对象调用类义务上,nano仍较前代实现明显晋升。


OpenAI表示,nano的设计优先级在于低延迟与低成本,而非周全机能,开辟者在选型时需结合具体义务衡量弃取。

子智能体架构,多模型协作成产品设计新范式

OpenAI在宣布资估中侧重强调了两款新模型在多模型分层体系中的地位。

以其自研编程助手Codex为例,GPT-5.4负责筹划、调和与最终断定,而GPT-5.4 mini子智能体则并行处理代码库检索、大年夜文件核阅及帮助文档处理等粒度更细的子义务。

OpenAI表示,跟着小型模型速度更快、功能更强大年夜,开辟者无需应用单一模型处理所有义务,而是可以构建体系,由大年夜型模型负责决定计划,小型模型则快速大年夜范围地履行义务。OpenAI称:

GPT-5.4 mini 是我们迄今为止针对这种工作流程最强大年夜的小型模型。

这一架构对高并发的工作尤为关键,在编程助手、截图解析及及时图像懂得等场景中,响应延迟直接影响产品体感,最优选择往往不是才能最强的模型,而是可以或许在速度、对象靠得住性与义务表示之间取得最佳均衡的模型。

对开辟者而言,GPT-5.4 mini与nano的宣布意味着在不就义体系整体智能程度的前提下,大年夜幅压降推理成本的路径进一步清楚。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部