2026-03-06发表2026-03-06更新ChatGPT19 分钟读完 (大约2898个字)

GPT-5.4 深夜上线！百万上下文+原生操作电脑，OpenClaw 天选模型来了！【附GPT升级教程】

就在今天深夜，OpenAI继GPT5.3 Instant之后又推出了一个全新模型—— GPT 5.4

OpenAI 对 GPT-5.4 的定位是：面向专业工作的最强、最高效的前沿模型，并且它已经同时上线 ChatGPT、API 和 Codex。另外还有更高规格的 GPT-5.4 Pro。

GPT-5.4 还是 OpenAI 首个把 GPT-5.3-codex 级代码能力并入主线推理模型的版本，也就是不再把“会写代码”和“懂业务/懂知识”分在两个模型上。

那么，它本次更新最核心的加强点在哪呢？我们要怎么快速升级到GPT-5.4呢？为什么说它是OpenClaw的天选模型呢？另外OpenClaw该如何切换到GPT-5.4呢？

GPT-5.4 的核心加强点

真实工作能力明显增强

这次 GPT-5.4 最核心的提升，不是单一学术跑分，而是真实专业工作任务。

GDPval（真实专业工作任务表现）：GPT-5.4 为 83.0% ，GPT-5.2 为 70.9% ，提升 12.1 个百分点 。
Investment Banking Modeling Tasks（内部投行建模评测） ：GPT-5.4 为 87.3% ，GPT-5.2 为 68.4% ，提升 18.9 个百分点 。
OfficeQA（企业文档推理能力） ：GPT-5.4 为 68.1% ，GPT-5.2 为 63.1% 。

这说明 GPT-5.4 的提升重点不是“更会考试”，而是更接近真实办公、分析、报告、建模、执行型知识工作。

代码能力保住了，而且进入主线模型

GPT-5.4 最大的价值之一，是它没有为了加强通用能力而牺牲代码能力。

SWE-Bench Pro（Public）：GPT-5.4 为 57.7%
GPT-5.3-Codex 为 56.8%
GPT-5.2 为 55.6%

也就是说，GPT-5.4 基本把 GPT-5.3-Codex 那一档的工程能力接到了主线模型里，同时补上了知识理解和业务表达能力。

需要注意的是，Terminal-Bench 2.0 上 GPT-5.4 是 75.1%，低于 GPT-5.3-Codex 的 77.3% ，所以更准确的说法不是“全维度代码都碾压 Codex”，而是：在关键公开软件工程基准上略强，整体工程能力已进入 Codex 档位，但并非每个 coding benchmark 都全面领先。

电脑操作能力是这次最亮眼的升级之一

GPT-5.4 是 OpenAI 首个原生支持 computer use 的主线通用模型。官方描述里，它可以结合屏幕内容进行鼠标、键盘等操作，并且面向跨步骤任务。

关键数据：

OSWorld-Verified：GPT-5.4 为 75.0%
GPT-5.3-Codex 为 74.0%
GPT-5.2 为 47.3%

如果和 Anthropic 官方公布的成绩对比，Claude Opus 4.6：72.7%

从官方可核对数据来看，GPT-5.4 目前在这个基准上略高于 Claude Opus 4.6。

我们也可以从官方视频中直观体验到操作流畅度

工具使用和 Agent 能力更强

OpenAI 这次还重点强化了 GPT-5.4 的工具调用与 agentic 工作流能力。

BrowseComp：GPT-5.4 为 82.7% ，GPT-5.2 为 65.8% 。
Toolathlon：GPT-5.4 为 54.6% ，GPT-5.2 为 45.7% 。
MCP Atlas：GPT-5.4 为 67.2% ，GPT-5.2 为 60.6% 。

另外，OpenAI 还明确提到 GPT-5.4 支持 tool search 这一类机制：不是把全部工具定义都塞进上下文，而是需要时再检索工具定义。这对于工具很多的 Agent 系统，能减少上下文浪费，提升效率。

百万上下文

API 官方页面给出的 GPT-5.4 参数是：

上下文窗口：1,050,000 tokens
最大输出：128,000 tokens

价格方面：

gpt-5.4：输入 $2.50 / 1M tokens，缓存输入 $0.25 / 1M，输出 $15 / 1M
gpt-5.4-pro：输入 $30 / 1M，输出 $180 / 1M

同时官方说明，当输入超过 272K tokens 时，GPT-5.4 / GPT-5.4 Pro 会按更高费率计费。

GPT-5.4 与目前主流模型对比

和 GPT-5.3-Codex 比

更准确的说法不是“全面吊打”，而是：

代码主干能力已经接近甚至略强于 GPT-5.3-Codex
世界知识、业务理解、事实性、专业工作能力明显更完整
电脑操作与工具使用也更均衡

所以 GPT-5.4 的价值在于：它把 Codex 的工程腿补进了主线模型，但同时保留了通用模型该有的表达和知识能力。

和 Claude Opus 4.6 比

从官方可核对数据看：

在 OSWorld 上，GPT-5.4 75.0% ，Claude Opus 4.6 72.7% 。

但不能简单说“GPT-5.4 全面赢过 Claude”。更准确的结论是：
GPT-5.4 在 OpenAI 这次主打的专业工作、工具使用、电脑操作方向上非常强，而且价格比 GPT-5.4 Pro 友好得多；Claude 依然在部分工程体验和一些场景中有自己的优势。

和 Gemini 3.1 Pro 比

Gemini 3.1 Pro 的优势主要集中在科学推理和数学类benchmark。例如在 GPQA Diamond（博士级科学问题）：

GPT-5.4 Pro：94.4%
Gemini 3.1 Pro：约 94% 左右

两者基本处于同一水平。

而在 FrontierMath（高等数学），GPT-5.4 Pro 略强。

不过在一些浏览与信息搜索类任务（例如 BrowseComp）中，Gemini 系列模型也有不错表现。

综合对比

从整体 benchmark 分布来看，三家模型的能力结构逐渐分化：

GPT-5.4：Agent 执行能力最强（工具、电脑操作、工作任务）
Claude Opus 4.6：写作与复杂代码任务依然表现稳定
Gemini 3.1 Pro：科学推理和搜索类任务更突出

👉因此如果是 Agent 框架或自动化系统（例如 OpenClaw），GPT-5.4 目前是更均衡的基座模型选择。

GPT-5.4 特别适配 OpenClaw?

这一点可以直接从 OpenClaw 需要的“基座模型能力结构”来理解。

OpenClaw 这类 Agent/自动化框架，本质上最需要四件事：

要有稳定的代码能力

OpenClaw 要做任务编排、脚本执行、工具调用、页面操作、报错修复，底层离不开代码能力。GPT-5.4 在 SWE-Bench Pro 上 57.7% ，已经进入 GPT-5.3-Codex 这一档。

要有足够强的世界知识和业务理解

单纯会写代码，不代表能理解任务目标、业务语义、用户意图。GPT-5.4 在 GDPval、OfficeQA、投行建模这些更接近真实工作的基准上都显著强于 GPT-5.2，说明它更适合做“不是纯编程”的 Agent。

要能看、能用工具、能跨步骤执行

OpenClaw 的价值不只是“聊天”，而是执行。GPT-5.4 这次在 OSWorld-Verified 75.0%、Toolathlon 54.6%、BrowseComp 82.7% 的表现，说明它更适合作为执行型模型，而不只是回答型模型。

成本和上下文要扛得住

Agent 系统最怕两件事：太贵，以及上下文不够长。GPT-5.4 API 价格是 ＄2.5 / ＄15，上下文是 1.05M，对于需要长任务链、长文档、长代码仓库的场景，比“高价旗舰但难大规模跑”的方案更容易落地。

👉GPT-5.4 把 GPT-5.3 Codex 的强代码能力、比 GPT-5.2 更全面的世界知识、更出色的工具使用能力，以及便宜到离谱的 Codex 额度集于一身——这四项优势合体，足以让它成为 OpenClaw 的完美天选基座模型。

如何使用到GPT-5.4呢？

面向群体有哪些？

即日起，GPT-5.4 向 ChatGPT Go、Plus、Team 和 Pro 等付费用户开放，替代 GPT-5.2 Thinking 成为默认思考模型，GPT-5.4 Pro 目前仅面向 Pro 和 Enterprise 计划开放

在 ChatGPT 中：

GPT-5.4 以 GPT-5.4 Thinking 的形式提供给付费用户。
Plus / Business 用户手动选择 GPT-5.4 Thinking，额度为每周最多 3000 条消息。
Go 用户启用 Thinking 后，额度是每 5 小时 10 条。

之后也会陆续在 API 和 Codex 上逐步推送，Codex可以直接更新切换模型

API的整体价格如下：

相比下看价格还是有所提升的，但已经比Claude便宜很多了，但性价比绝对比claude高的。

如何快速升级GPT5.4？

如果你有自己的GPT账号，但苦于没有虚拟卡、海外信用卡，也不知道找稳定的升级方法

那你可以通过我们的 OpenAI 自助代充平台，完全不用找代充、也不用担心被骗，我们会全程提供质保售后服务，已稳定充值半年多了！！！

其他地区正规官方充值
支持 24 小时自助升级
无需海外卡，两分钟搞定
低于0.01%封号率，包质保

直达入口👉：gptplus.uno

(复制到浏览器中打开)

👉不管你是充值Go、Plus、Pro，还是Business(team)，都可以在商城中找到（部分较高费用的将人工特殊处理）

OpenClaw如何切换到GPT5.4？

OpenClaw 现在是支持 OpenAI 的，而且分两种方式：

用 ChatGPT/Codex 登录（OAuth，走订阅额度）
用 OpenAI API Key（走 API 计费，或第三方平台）

直接切到 ChatGPT 授权，最直接的是跑 OpenClaw 的向导：

1	openclaw onboard

在向导里选 OpenAI Code (Codex) subscription / OpenAI Codex OAuth 这一类选项。OpenClaw 官方文档给的等价命令是：

1	openclaw onboard --auth-choice openai-codex

如果你已经装好了，只是想补登录，也可以用：

1	openclaw models auth login --provider openai-codex

这一步会拉起浏览器，让你 Sign in with ChatGPT 完成授权。OpenAI 官方的 Codex 认证文档也确认：Codex 支持 Sign in with ChatGPT 和 API key 两种登录方式

如果你想一步到位，基本就是这套：

1	openclaw onboard --auth-choice openai-codex

浏览器里登录 ChatGPT 后，再把默认模型改成：

1	openai-codex/gpt-5.4

如果你是手改配置，就把 agents.defaults.model.primary 改成上面这个值。OpenClaw 官方模型文档说明，默认主模型就是在这个配置键里设的。

👉更简单的方法：在服务器上装个codex，把需要信息发给codex，让他帮你配置并切换到gpt-5.4，”手残党”福星！！！！

最后有话说

一句话总结：GPT-5.4 最重要的不是更强，而是更完整。 它把 Agent 真正需要的几块能力，第一次比较像样地拼到了一起。

也正因为这种“完整度”的提升，它才不只是一个新模型，更像是 2026 年这一波 AI 从“会回答”继续往“会执行”推进时，一个很关键的节点。

可能2026年之前大家都在卷模型，而现在是卷Agent..

最后感谢大家能够看到文章的最后，如果你觉得这篇文章对你有启发或者帮助，不妨点个关注，你的支持将是我最大的动力，谢谢！

GPT-5.4 深夜上线！百万上下文+原生操作电脑，OpenClaw 天选模型来了！【附GPT升级教程】

https://gptguide.cn/pages/gpt-5-4-openclaw-update-guide/

作者

yueshiwa

发布于

2026-03-06

更新于

2026-03-06

许可协议

#ChatGPT OpenClaw

微信

GPT-5.4 深夜上线！百万上下文+原生操作电脑，OpenClaw 天选模型来了！【附GPT升级教程】

GPT-5.4 的核心加强点

真实工作能力明显增强

代码能力保住了，而且进入主线模型

电脑操作能力是这次最亮眼的升级之一

工具使用和 Agent 能力更强

百万上下文

GPT-5.4 与目前主流模型对比

和 GPT-5.3-Codex 比

和 Claude Opus 4.6 比

和 Gemini 3.1 Pro 比

综合对比

GPT-5.4 特别适配 OpenClaw?

要有稳定的代码能力

要有足够强的世界知识和业务理解

要能看、能用工具、能跨步骤执行

成本和上下文要扛得住

如何使用到GPT-5.4呢？

面向群体有哪些？

如何快速升级GPT5.4？

OpenClaw如何切换到GPT5.4？

最后有话说

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

标签

链接

分类

最新文章

归档