GPT-5.4
去試試

GPT-5.4

GPT-5.4:原生 Computer Use、Tool Search 與超長上下文

面向生產級 Agent 與編碼系統:在單次請求中處理完整代碼庫或長文檔,支援可調推理強度(none 至 xhigh),並在 LimaxAI 聊天中與站內其他前沿模型共用同一工作臺。

  • 1.05M 上下文
  • 128K 最大輸出
  • 原生 Computer Use
  • Tool Search
  • 可調推理強度

> tool_search("browser.navigate")

// Computer Use · screenshot + action

> context: 1.05M tokens · output budget: 128K

// reasoning: high · tools: 42 matched

核心能力

關鍵能力一覽

參考公開產品資料整理的 GPT-5.4 能力要點;具體開關與參數以 LimaxAI 聊天內實際展示為準。

1.05M 上下文窗口

單次請求可容納完整代碼倉庫、長篇政策或研究材料級別的輸入。

128K 最大輸出

一次響應可生成完整報告、長實現或大段結構化內容。

原生 Computer Use

通過截圖與鍵鼠指令操作界面,適合瀏覽器與桌面應用程式的多步驟任務(公開基準 OSWorld 75.0%)。

Tool Search

從更大工具生態中按需發現與調用,避免每次 prompt 塞滿全部工具定義。

可調推理強度

按延遲、深度與任務難度在 none 到 xhigh 之間選擇 reasoning effort。

更高 Token 效率

公開資料稱在許多高難任務上相較 GPT-5.2 使用更少 tokens。

模型對比

GPT-5.4 與前沿模型(定性)

面向選型決策的快速對照;扣費與可用性以 LimaxAI 價格頁與模型列表為準,非實時價目。

Claude Opus 4.6、Gemini 3.1 Pro 為公開對比中常見的對標型號;上下文與單次輸出上限隨版本變化。

維度GPT-5.4Claude Opus 4.6Gemini 3.1 Pro
上下文窗口1.05M200K(1M beta)1M
最大輸出128K128K64K
原生 Computer Use
Tool Search
推理控制none 至 xhighstandard / extended公開控制項有限

應用場景

你可以用 GPT-5.4 構建什麼

下列場景與公開產品資料中的 GPT-5.4 敘事一致;配圖為概念示意。

可操作瀏覽器與桌面的自主 Agent

構建能點選、輸入、瀏覽並完成多步驟界面任務的 Agent;藉助原生 Computer Use 驗證工作流後再上線。

完整代碼庫與長文檔分析

在單次請求中處理完整倉庫、長政策或大型研究材料,適合架構審閱與依賴分析。

企業工具生態的 Tool Search 編排

依賴大量內部 API、工具或 MCP 連接器時,讓模型按需選擇正確工具,減少無效 token 浪費。

基準表現

基準對比:GPT-5.4 vs GPT-5.2

公開基準展示 GPT-5.4 在專業任務、工具使用、網頁瀏覽與 computer use 上的提升;僅供參考。

基準項GPT-5.4GPT-5.2
GDPval83.0%70.9%
SWE-Bench Pro57.7%55.6%
OSWorld(人類 72.4%)75.0%47.3%
BrowseComp82.7%65.8%
每聲明事實錯誤率少 33%基線

平台價值

為什麼在 LimaxAI 裡用

與站內其他對話模型共用聊天體驗,無需為單一模型單獨維護密鑰或控制檯。

統一的聊天工作臺

在模型列表中切換 GPT-5.4 與 Claude、Gemini 等模型,歷史與附件能力以目前版本為準。

積分計費一體化

按 LimaxAI 公示的聊天計費與積分規則扣減,便於與團隊內其他模型對比成本。

流式輸出與現有客戶端一致

沿用 LimaxAI 聊天已對接的流式管線,適合長回覆與迭代式調試。

接入步驟

如何開始

從註冊到生產監控,三步上手。

  1. 登入 LimaxAI

    註冊並進入對話頁,在模型列表中查找 GPT-5.4 或名稱相近的條目。

  2. 發送第一條請求

    用自然語言描述任務,必要時附上代碼片段、截圖或工具說明;複雜任務可逐步提高 reasoning effort(若產品內提供)。

  3. 迭代並擴展

    結合價格頁與用量明細控制成本;滿意後將工作流推廣到團隊或 Agent 管線。

常見問答

常見問題

在 LimaxAI 裡如何選用 GPT-5.4?

進入「對話」頁,在模型下拉列表中選擇帶 GPT-5.4 字樣的條目。列表由後端接口下發,名稱與可見性會隨營運配置變化。

GPT-5.4 和 GPT-5.2 有什麼區別?

公開資料稱 GPT-5.4 上下文約為 GPT-5.2 的 2.6 倍,並新增原生 Computer Use 與 Tool Search,在許多高難任務上 token 效率更高。

什麼是原生 Computer Use?

模型可根據截圖與鍵鼠動作直接操作界面,包括瀏覽網站與完成多步驟交互,而不必額外接專用 computer-use 模型。

什麼是 Tool Search?

讓模型從更大工具集中自動發現並選擇合適工具,而不是在每次 prompt 中嵌入全部工具定義,有助於提升 Agent 品質並節省 token。

上下文很大,是否每次都能貼整倉?

1.05M 是能力上限;實際仍可能受請求體大小、附件策略、風控與限流影響。遇到失敗時應拆分或精簡輸入。

對話積分如何計費?

按所選聊天模型與 LimaxAI 公示的積分規則計費;以價格頁與個人消費明細為準。

在 LimaxAI 對話中試用

用真實任務試一條 GPT-5.4

打開聊天,在模型列表中選擇 GPT-5.4,從編碼、長文檔或 Agent 草稿開始驗證。