GPT-5.4
去试试

GPT-5.4

GPT-5.4:原生 Computer Use、Tool Search 与超长上下文

面向生产级 Agent 与编码系统:在单次请求中处理完整代码库或长文档,支持可调推理强度(none 至 xhigh),并在 LimaxAI 聊天中与站内其他前沿模型共用同一工作台。

  • 1.05M 上下文
  • 128K 最大输出
  • 原生 Computer Use
  • Tool Search
  • 可调推理强度

> tool_search("browser.navigate")

// Computer Use · screenshot + action

> context: 1.05M tokens · output budget: 128K

// reasoning: high · tools: 42 matched

核心能力

关键能力一览

参考公开产品资料整理的 GPT-5.4 能力要点;具体开关与参数以 LimaxAI 聊天内实际展示为准。

1.05M 上下文窗口

单次请求可容纳完整代码仓库、长篇政策或研究材料级别的输入。

128K 最大输出

一次响应可生成完整报告、长实现或大段结构化内容。

原生 Computer Use

通过截图与键鼠指令操作界面,适合浏览器与桌面软件的多步骤任务(公开基准 OSWorld 75.0%)。

Tool Search

从更大工具生态中按需发现与调用,避免每次 prompt 塞满全部工具定义。

可调推理强度

按延迟、深度与任务难度在 none 到 xhigh 之间选择 reasoning effort。

更高 Token 效率

公开资料称在许多高难任务上相较 GPT-5.2 使用更少 tokens。

模型对比

GPT-5.4 与前沿模型(定性)

面向选型决策的快速对照;扣费与可用性以 LimaxAI 价格页与模型列表为准,非实时价目。

Claude Opus 4.6、Gemini 3.1 Pro 为公开对比中常见的对标型号;上下文与单次输出上限随版本变化。

维度GPT-5.4Claude Opus 4.6Gemini 3.1 Pro
上下文窗口1.05M200K(1M beta)1M
最大输出128K128K64K
原生 Computer Use
Tool Search
推理控制none 至 xhighstandard / extended公开控制项有限

应用场景

你可以用 GPT-5.4 构建什么

下列场景与公开产品资料中的 GPT-5.4 叙事一致;配图为概念示意。

可操作浏览器与桌面的自主 Agent

构建能点击、输入、浏览并完成多步骤界面任务的 Agent;借助原生 Computer Use 验证工作流后再上线。

完整代码库与长文档分析

在单次请求中处理完整仓库、长政策或大型研究材料,适合架构审阅与依赖分析。

企业工具生态的 Tool Search 编排

依赖大量内部 API、工具或 MCP 连接器时,让模型按需选择正确工具,减少无效 token 浪费。

基准表现

基准对比:GPT-5.4 vs GPT-5.2

公开基准展示 GPT-5.4 在专业任务、工具使用、网页浏览与 computer use 上的提升;仅供参考。

基准项GPT-5.4GPT-5.2
GDPval83.0%70.9%
SWE-Bench Pro57.7%55.6%
OSWorld(人类 72.4%)75.0%47.3%
BrowseComp82.7%65.8%
每声明事实错误率少 33%基线

平台价值

为什么在 LimaxAI 里用

与站内其他对话模型共用聊天体验,无需为单一模型单独维护密钥或控制台。

统一的聊天工作台

在模型列表中切换 GPT-5.4 与 Claude、Gemini 等模型,历史与附件能力以当前版本为准。

积分计费一体化

按 LimaxAI 公示的聊天计费与积分规则扣减,便于与团队内其他模型对比成本。

流式输出与现有客户端一致

沿用 LimaxAI 聊天已对接的流式管线,适合长回复与迭代式调试。

接入步骤

如何开始

从注册到生产监控,三步上手。

  1. 登录 LimaxAI

    注册并进入对话页,在模型列表中查找 GPT-5.4 或名称相近的条目。

  2. 发送第一条请求

    用自然语言描述任务,必要时附上代码片段、截图或工具说明;复杂任务可逐步提高 reasoning effort(若产品内提供)。

  3. 迭代并扩展

    结合价格页与用量明细控制成本;满意后将工作流推广到团队或 Agent 管线。

常见问答

常见问题

在 LimaxAI 里如何选用 GPT-5.4?

进入「对话」页,在模型下拉列表中选择带 GPT-5.4 字样的条目。列表由后端接口下发,名称与可见性会随运营配置变化。

GPT-5.4 和 GPT-5.2 有什么区别?

公开资料称 GPT-5.4 上下文约为 GPT-5.2 的 2.6 倍,并新增原生 Computer Use 与 Tool Search,在许多高难任务上 token 效率更高。

什么是原生 Computer Use?

模型可根据截图与键鼠动作直接操作界面,包括浏览网站与完成多步骤交互,而不必额外接专用 computer-use 模型。

什么是 Tool Search?

让模型从更大工具集中自动发现并选择合适工具,而不是在每次 prompt 中嵌入全部工具定义,有助于提升 Agent 质量并节省 token。

上下文很大,是否每次都能贴整仓?

1.05M 是能力上限;实际仍可能受请求体大小、附件策略、风控与限流影响。遇到失败时应拆分或精简输入。

对话积分如何计费?

按所选聊天模型与 LimaxAI 公示的积分规则计费;以价格页与个人消费明细为准。

在 LimaxAI 对话中试用

用真实任务试一条 GPT-5.4

打开聊天,在模型列表中选择 GPT-5.4,从编码、长文档或 Agent 草稿开始验证。