GPT-5.4 深夜上线!百万上下文+原生操作电脑,OpenClaw 天选模型来了!【附GPT升级教程】
就在今天深夜,OpenAI继GPT5.3 Instant之后又推出了一个全新模型—— GPT 5.4

OpenAI 对 GPT-5.4 的定位是:面向专业工作的最强、最高效的前沿模型,并且它已经同时上线 ChatGPT、API 和 Codex。另外还有更高规格的 GPT-5.4 Pro。
GPT-5.4 还是 OpenAI 首个把 GPT-5.3-codex 级代码能力并入主线推理模型的版本,也就是不再把“会写代码”和“懂业务/懂知识”分在两个模型上。
那么,它本次更新最核心的加强点在哪呢?我们要怎么快速升级到GPT-5.4呢?为什么说它是OpenClaw的天选模型呢?另外OpenClaw该如何切换到GPT-5.4呢?
GPT-5.4 的核心加强点
真实工作能力明显增强
这次 GPT-5.4 最核心的提升,不是单一学术跑分,而是真实专业工作任务。

- GDPval(真实专业工作任务表现):GPT-5.4 为 83.0% ,GPT-5.2 为 70.9% ,提升 12.1 个百分点 。
- Investment Banking Modeling Tasks(内部投行建模评测) :GPT-5.4 为 87.3% ,GPT-5.2 为 68.4% ,提升 18.9 个百分点 。
- OfficeQA(企业文档推理能力) :GPT-5.4 为 68.1% ,GPT-5.2 为 63.1% 。
这说明 GPT-5.4 的提升重点不是“更会考试”,而是更接近真实办公、分析、报告、建模、执行型知识工作。
代码能力保住了,而且进入主线模型
GPT-5.4 最大的价值之一,是它没有为了加强通用能力而牺牲代码能力。

- SWE-Bench Pro(Public):GPT-5.4 为 57.7%
- GPT-5.3-Codex 为 56.8%
- GPT-5.2 为 55.6%
也就是说,GPT-5.4 基本把 GPT-5.3-Codex 那一档的工程能力接到了主线模型里,同时补上了知识理解和业务表达能力。
需要注意的是,Terminal-Bench 2.0 上 GPT-5.4 是 75.1%,低于 GPT-5.3-Codex 的 77.3% ,所以更准确的说法不是“全维度代码都碾压 Codex”,而是:在关键公开软件工程基准上略强,整体工程能力已进入 Codex 档位,但并非每个 coding benchmark 都全面领先。
电脑操作能力是这次最亮眼的升级之一
GPT-5.4 是 OpenAI 首个原生支持 computer use 的主线通用模型。官方描述里,它可以结合屏幕内容进行鼠标、键盘等操作,并且面向跨步骤任务。

关键数据:
- OSWorld-Verified:GPT-5.4 为 75.0%
- GPT-5.3-Codex 为 74.0%
- GPT-5.2 为 47.3%
如果和 Anthropic 官方公布的成绩对比,Claude Opus 4.6:72.7%

从官方可核对数据来看,GPT-5.4 目前在这个基准上略高于 Claude Opus 4.6。
我们也可以从官方视频中直观体验到操作流畅度
工具使用和 Agent 能力更强
OpenAI 这次还重点强化了 GPT-5.4 的工具调用与 agentic 工作流能力。

- BrowseComp:GPT-5.4 为 82.7% ,GPT-5.2 为 65.8% 。
- Toolathlon:GPT-5.4 为 54.6% ,GPT-5.2 为 45.7% 。
- MCP Atlas:GPT-5.4 为 67.2% ,GPT-5.2 为 60.6% 。
另外,OpenAI 还明确提到 GPT-5.4 支持 tool search 这一类机制:不是把全部工具定义都塞进上下文,而是需要时再检索工具定义。这对于工具很多的 Agent 系统,能减少上下文浪费,提升效率。
百万上下文
API 官方页面给出的 GPT-5.4 参数是:
- 上下文窗口:1,050,000 tokens
- 最大输出:128,000 tokens
价格方面:
- gpt-5.4:输入 $2.50 / 1M tokens,缓存输入 $0.25 / 1M,输出 $15 / 1M
- gpt-5.4-pro:输入 $30 / 1M,输出 $180 / 1M
同时官方说明,当输入超过 272K tokens 时,GPT-5.4 / GPT-5.4 Pro 会按更高费率计费。
GPT-5.4 与目前主流模型对比

和 GPT-5.3-Codex 比
更准确的说法不是“全面吊打”,而是:
- 代码主干能力已经接近甚至略强于 GPT-5.3-Codex
- 世界知识、业务理解、事实性、专业工作能力明显更完整
- 电脑操作与工具使用也更均衡
所以 GPT-5.4 的价值在于:它把 Codex 的工程腿补进了主线模型,但同时保留了通用模型该有的表达和知识能力。
和 Claude Opus 4.6 比
从官方可核对数据看:
- 在 OSWorld 上,GPT-5.4 75.0% ,Claude Opus 4.6 72.7% 。
但不能简单说“GPT-5.4 全面赢过 Claude”。更准确的结论是:
GPT-5.4 在 OpenAI 这次主打的专业工作、工具使用、电脑操作方向上非常强,而且价格比 GPT-5.4 Pro 友好得多;Claude 依然在部分工程体验和一些场景中有自己的优势。
和 Gemini 3.1 Pro 比
Gemini 3.1 Pro 的优势主要集中在 科学推理和数学类benchmark。例如在 GPQA Diamond(博士级科学问题):
- GPT-5.4 Pro:94.4%
- Gemini 3.1 Pro:约 94% 左右
两者基本处于同一水平。
而在 FrontierMath(高等数学),GPT-5.4 Pro 略强。
不过在一些 浏览与信息搜索类任务(例如 BrowseComp)中,Gemini 系列模型也有不错表现。
综合对比
从整体 benchmark 分布来看,三家模型的能力结构逐渐分化:
- GPT-5.4:Agent 执行能力最强(工具、电脑操作、工作任务)
- Claude Opus 4.6:写作与复杂代码任务依然表现稳定
- Gemini 3.1 Pro:科学推理和搜索类任务更突出
👉因此如果是 Agent 框架或自动化系统(例如 OpenClaw),GPT-5.4 目前是更均衡的基座模型选择。
GPT-5.4 特别适配 OpenClaw?

这一点可以直接从 OpenClaw 需要的“基座模型能力结构”来理解。
OpenClaw 这类 Agent/自动化框架,本质上最需要四件事:
要有稳定的代码能力
OpenClaw 要做任务编排、脚本执行、工具调用、页面操作、报错修复,底层离不开代码能力。GPT-5.4 在 SWE-Bench Pro 上 57.7% ,已经进入 GPT-5.3-Codex 这一档。
要有足够强的世界知识和业务理解
单纯会写代码,不代表能理解任务目标、业务语义、用户意图。GPT-5.4 在 GDPval、OfficeQA、投行建模这些更接近真实工作的基准上都显著强于 GPT-5.2,说明它更适合做“不是纯编程”的 Agent。
要能看、能用工具、能跨步骤执行
OpenClaw 的价值不只是“聊天”,而是执行。GPT-5.4 这次在 OSWorld-Verified 75.0%、Toolathlon 54.6%、BrowseComp 82.7% 的表现,说明它更适合作为执行型模型,而不只是回答型模型。
成本和上下文要扛得住
Agent 系统最怕两件事:太贵,以及上下文不够长。GPT-5.4 API 价格是 $2.5 / $15,上下文是 1.05M,对于需要长任务链、长文档、长代码仓库的场景,比“高价旗舰但难大规模跑”的方案更容易落地。
👉GPT-5.4 把 GPT-5.3 Codex 的强代码能力、比 GPT-5.2 更全面的世界知识、更出色的工具使用能力,以及便宜到离谱的 Codex 额度集于一身——这四项优势合体,足以让它成为 OpenClaw 的完美天选基座模型。
如何使用到GPT-5.4呢?
面向群体有哪些?
即日起,GPT-5.4 向 ChatGPT Go、Plus、Team 和 Pro 等付费用户开放,替代 GPT-5.2 Thinking 成为默认思考模型,GPT-5.4 Pro 目前仅面向 Pro 和 Enterprise 计划开放

在 ChatGPT 中:
- GPT-5.4 以 GPT-5.4 Thinking 的形式提供给付费用户。
- Plus / Business 用户手动选择 GPT-5.4 Thinking,额度为每周最多 3000 条消息。
- Go 用户启用 Thinking 后,额度是每 5 小时 10 条。
之后也会陆续在 API 和 Codex 上逐步推送,Codex可以直接更新切换模型

API的整体价格如下:

相比下看价格还是有所提升的,但已经比Claude便宜很多了,但性价比绝对比claude高的。
如何快速升级GPT5.4?
如果你有自己的GPT账号,但苦于没有虚拟卡、海外信用卡,也不知道找稳定的升级方法
那你可以通过我们的 OpenAI 自助代充平台,完全不用找代充、也不用担心被骗,我们会全程提供质保售后服务,已稳定充值半年多了!!!
- 其他地区正规官方充值
- 支持 24 小时自助升级
- 无需海外卡,两分钟搞定
- 低于0.01%封号率,包质保
直达入口👉:gptplus.uno
(复制到浏览器中打开)

👉不管你是充值Go、Plus、Pro,还是Business(team),都可以在商城中找到(部分较高费用的将人工特殊处理)
OpenClaw如何切换到GPT5.4?
OpenClaw 现在是支持 OpenAI 的,而且分两种方式:
- 用 ChatGPT/Codex 登录(OAuth,走订阅额度)
- 用 OpenAI API Key(走 API 计费,或第三方平台)
直接切到 ChatGPT 授权,最直接的是跑 OpenClaw 的向导:
1 | openclaw onboard |
在向导里选 OpenAI Code (Codex) subscription / OpenAI Codex OAuth 这一类选项。OpenClaw 官方文档给的等价命令是:
1 | openclaw onboard --auth-choice openai-codex |
如果你已经装好了,只是想补登录,也可以用:
1 | openclaw models auth login --provider openai-codex |
这一步会拉起浏览器,让你 Sign in with ChatGPT 完成授权。OpenAI 官方的 Codex 认证文档也确认:Codex 支持 Sign in with ChatGPT 和 API key 两种登录方式
如果你想一步到位,基本就是这套:
1 | openclaw onboard --auth-choice openai-codex |
浏览器里登录 ChatGPT 后,再把默认模型改成:
1 | openai-codex/gpt-5.4 |
如果你是手改配置,就把 agents.defaults.model.primary 改成上面这个值。OpenClaw 官方模型文档说明,默认主模型就是在这个配置键里设的。
👉更简单的方法:在服务器上装个codex,把需要信息发给codex,让他帮你配置并切换到gpt-5.4,”手残党”福星!!!!
最后有话说
一句话总结:GPT-5.4 最重要的不是更强,而是更完整。 它把 Agent 真正需要的几块能力,第一次比较像样地拼到了一起。
也正因为这种“完整度”的提升,它才不只是一个新模型,更像是 2026 年这一波 AI 从“会回答”继续往“会执行”推进时,一个很关键的节点。
可能2026年之前大家都在卷模型,而现在是卷Agent..
最后感谢大家能够看到文章的最后,如果你觉得这篇文章对你有启发或者帮助,不妨点个关注,你的支持将是我最大的动力,谢谢!

GPT-5.4 深夜上线!百万上下文+原生操作电脑,OpenClaw 天选模型来了!【附GPT升级教程】
