1.05M 上下文窗口
单次请求可容纳完整代码仓库、长篇政策或研究材料级别的输入。
GPT-5.4
面向生产级 Agent 与编码系统:在单次请求中处理完整代码库或长文档,支持可调推理强度(none 至 xhigh),并在 LimaxAI 聊天中与站内其他前沿模型共用同一工作台。
> tool_search("browser.navigate")
// Computer Use · screenshot + action
> context: 1.05M tokens · output budget: 128K
// reasoning: high · tools: 42 matched
核心能力
参考公开产品资料整理的 GPT-5.4 能力要点;具体开关与参数以 LimaxAI 聊天内实际展示为准。
单次请求可容纳完整代码仓库、长篇政策或研究材料级别的输入。
一次响应可生成完整报告、长实现或大段结构化内容。
通过截图与键鼠指令操作界面,适合浏览器与桌面软件的多步骤任务(公开基准 OSWorld 75.0%)。
从更大工具生态中按需发现与调用,避免每次 prompt 塞满全部工具定义。
按延迟、深度与任务难度在 none 到 xhigh 之间选择 reasoning effort。
公开资料称在许多高难任务上相较 GPT-5.2 使用更少 tokens。
模型对比
面向选型决策的快速对照;扣费与可用性以 LimaxAI 价格页与模型列表为准,非实时价目。
Claude Opus 4.6、Gemini 3.1 Pro 为公开对比中常见的对标型号;上下文与单次输出上限随版本变化。
| 维度 | GPT-5.4 | Claude Opus 4.6 | Gemini 3.1 Pro |
|---|---|---|---|
| 上下文窗口 | 1.05M | 200K(1M beta) | 1M |
| 最大输出 | 128K | 128K | 64K |
| 原生 Computer Use | 是 | 否 | 否 |
| Tool Search | 是 | 否 | 否 |
| 推理控制 | none 至 xhigh | standard / extended | 公开控制项有限 |
应用场景
下列场景与公开产品资料中的 GPT-5.4 叙事一致;配图为概念示意。
构建能点击、输入、浏览并完成多步骤界面任务的 Agent;借助原生 Computer Use 验证工作流后再上线。
在单次请求中处理完整仓库、长政策或大型研究材料,适合架构审阅与依赖分析。
依赖大量内部 API、工具或 MCP 连接器时,让模型按需选择正确工具,减少无效 token 浪费。
基准表现
公开基准展示 GPT-5.4 在专业任务、工具使用、网页浏览与 computer use 上的提升;仅供参考。
| 基准项 | GPT-5.4 | GPT-5.2 |
|---|---|---|
| GDPval | 83.0% | 70.9% |
| SWE-Bench Pro | 57.7% | 55.6% |
| OSWorld(人类 72.4%) | 75.0% | 47.3% |
| BrowseComp | 82.7% | 65.8% |
| 每声明事实错误率 | 少 33% | 基线 |
平台价值
与站内其他对话模型共用聊天体验,无需为单一模型单独维护密钥或控制台。
在模型列表中切换 GPT-5.4 与 Claude、Gemini 等模型,历史与附件能力以当前版本为准。
按 LimaxAI 公示的聊天计费与积分规则扣减,便于与团队内其他模型对比成本。
沿用 LimaxAI 聊天已对接的流式管线,适合长回复与迭代式调试。
接入步骤
从注册到生产监控,三步上手。
注册并进入对话页,在模型列表中查找 GPT-5.4 或名称相近的条目。
用自然语言描述任务,必要时附上代码片段、截图或工具说明;复杂任务可逐步提高 reasoning effort(若产品内提供)。
结合价格页与用量明细控制成本;满意后将工作流推广到团队或 Agent 管线。
常见问答
进入「对话」页,在模型下拉列表中选择带 GPT-5.4 字样的条目。列表由后端接口下发,名称与可见性会随运营配置变化。
公开资料称 GPT-5.4 上下文约为 GPT-5.2 的 2.6 倍,并新增原生 Computer Use 与 Tool Search,在许多高难任务上 token 效率更高。
模型可根据截图与键鼠动作直接操作界面,包括浏览网站与完成多步骤交互,而不必额外接专用 computer-use 模型。
让模型从更大工具集中自动发现并选择合适工具,而不是在每次 prompt 中嵌入全部工具定义,有助于提升 Agent 质量并节省 token。
1.05M 是能力上限;实际仍可能受请求体大小、附件策略、风控与限流影响。遇到失败时应拆分或精简输入。
按所选聊天模型与 LimaxAI 公示的积分规则计费;以价格页与个人消费明细为准。
在 LimaxAI 对话中试用
打开聊天,在模型列表中选择 GPT-5.4,从编码、长文档或 Agent 草稿开始验证。