GPT-5.4

GPT-5.4：原生 Computer Use、Tool Search 与超长上下文

面向生产级 Agent 与编码系统：在单次请求中处理完整代码库或长文档，支持可调推理强度（none 至 xhigh），并在 LimaxAI 聊天中与站内其他前沿模型共用同一工作台。

1.05M 上下文
128K 最大输出
原生 Computer Use
Tool Search
可调推理强度

> tool_search("browser.navigate")

// Computer Use · screenshot + action

> context: 1.05M tokens · output budget: 128K

// reasoning: high · tools: 42 matched

核心能力

关键能力一览

参考公开产品资料整理的 GPT-5.4 能力要点；具体开关与参数以 LimaxAI 聊天内实际展示为准。

1.05M 上下文窗口

单次请求可容纳完整代码仓库、长篇政策或研究材料级别的输入。

128K 最大输出

一次响应可生成完整报告、长实现或大段结构化内容。

原生 Computer Use

通过截图与键鼠指令操作界面，适合浏览器与桌面软件的多步骤任务（公开基准 OSWorld 75.0%）。

Tool Search

从更大工具生态中按需发现与调用，避免每次 prompt 塞满全部工具定义。

可调推理强度

按延迟、深度与任务难度在 none 到 xhigh 之间选择 reasoning effort。

更高 Token 效率

公开资料称在许多高难任务上相较 GPT-5.2 使用更少 tokens。

模型对比

GPT-5.4 与前沿模型（定性）

面向选型决策的快速对照；扣费与可用性以 LimaxAI 价格页与模型列表为准，非实时价目。

Claude Opus 4.6、Gemini 3.1 Pro 为公开对比中常见的对标型号；上下文与单次输出上限随版本变化。

维度	GPT-5.4	Claude Opus 4.6	Gemini 3.1 Pro
上下文窗口	1.05M	200K（1M beta）	1M
最大输出	128K	128K	64K
原生 Computer Use	是	否	否
Tool Search	是	否	否
推理控制	none 至 xhigh	standard / extended	公开控制项有限

应用场景

你可以用 GPT-5.4 构建什么

下列场景与公开产品资料中的 GPT-5.4 叙事一致；配图为概念示意。

可操作浏览器与桌面的自主 Agent

构建能点击、输入、浏览并完成多步骤界面任务的 Agent；借助原生 Computer Use 验证工作流后再上线。

完整代码库与长文档分析

在单次请求中处理完整仓库、长政策或大型研究材料，适合架构审阅与依赖分析。

企业工具生态的 Tool Search 编排

依赖大量内部 API、工具或 MCP 连接器时，让模型按需选择正确工具，减少无效 token 浪费。

基准表现

基准对比：GPT-5.4 vs GPT-5.2

公开基准展示 GPT-5.4 在专业任务、工具使用、网页浏览与 computer use 上的提升；仅供参考。

基准项	GPT-5.4	GPT-5.2
GDPval	83.0%	70.9%
SWE-Bench Pro	57.7%	55.6%
OSWorld（人类 72.4%）	75.0%	47.3%
BrowseComp	82.7%	65.8%
每声明事实错误率	少 33%	基线

平台价值

为什么在 LimaxAI 里用

与站内其他对话模型共用聊天体验，无需为单一模型单独维护密钥或控制台。

统一的聊天工作台

在模型列表中切换 GPT-5.4 与 Claude、Gemini 等模型，历史与附件能力以当前版本为准。

积分计费一体化

按 LimaxAI 公示的聊天计费与积分规则扣减，便于与团队内其他模型对比成本。

流式输出与现有客户端一致

沿用 LimaxAI 聊天已对接的流式管线，适合长回复与迭代式调试。

接入步骤

如何开始

从注册到生产监控，三步上手。

登录 LimaxAI
注册并进入对话页，在模型列表中查找 GPT-5.4 或名称相近的条目。
发送第一条请求
用自然语言描述任务，必要时附上代码片段、截图或工具说明；复杂任务可逐步提高 reasoning effort（若产品内提供）。
迭代并扩展
结合价格页与用量明细控制成本；满意后将工作流推广到团队或 Agent 管线。

常见问答

常见问题

在 LimaxAI 里如何选用 GPT-5.4？

进入「对话」页，在模型下拉列表中选择带 GPT-5.4 字样的条目。列表由后端接口下发，名称与可见性会随运营配置变化。

GPT-5.4 和 GPT-5.2 有什么区别？

公开资料称 GPT-5.4 上下文约为 GPT-5.2 的 2.6 倍，并新增原生 Computer Use 与 Tool Search，在许多高难任务上 token 效率更高。

什么是原生 Computer Use？

模型可根据截图与键鼠动作直接操作界面，包括浏览网站与完成多步骤交互，而不必额外接专用 computer-use 模型。

什么是 Tool Search？

让模型从更大工具集中自动发现并选择合适工具，而不是在每次 prompt 中嵌入全部工具定义，有助于提升 Agent 质量并节省 token。

上下文很大，是否每次都能贴整仓？

1.05M 是能力上限；实际仍可能受请求体大小、附件策略、风控与限流影响。遇到失败时应拆分或精简输入。

对话积分如何计费？

按所选聊天模型与 LimaxAI 公示的积分规则计费；以价格页与个人消费明细为准。

在 LimaxAI 对话中试用

用真实任务试一条 GPT-5.4

打开聊天，在模型列表中选择 GPT-5.4，从编码、长文档或 Agent 草稿开始验证。

进入对话返回首页