GPT-5.4

GPT-5.4：原生 Computer Use、Tool Search 與超長上下文

面向生產級 Agent 與編碼系統：在單次請求中處理完整代碼庫或長文檔，支援可調推理強度（none 至 xhigh），並在 LimaxAI 聊天中與站內其他前沿模型共用同一工作臺。

1.05M 上下文
128K 最大輸出
原生 Computer Use
Tool Search
可調推理強度

> tool_search("browser.navigate")

// Computer Use · screenshot + action

> context: 1.05M tokens · output budget: 128K

// reasoning: high · tools: 42 matched

核心能力

關鍵能力一覽

參考公開產品資料整理的 GPT-5.4 能力要點；具體開關與參數以 LimaxAI 聊天內實際展示為準。

1.05M 上下文窗口

單次請求可容納完整代碼倉庫、長篇政策或研究材料級別的輸入。

128K 最大輸出

一次響應可生成完整報告、長實現或大段結構化內容。

原生 Computer Use

通過截圖與鍵鼠指令操作界面，適合瀏覽器與桌面應用程式的多步驟任務（公開基準 OSWorld 75.0%）。

Tool Search

從更大工具生態中按需發現與調用，避免每次 prompt 塞滿全部工具定義。

可調推理強度

按延遲、深度與任務難度在 none 到 xhigh 之間選擇 reasoning effort。

更高 Token 效率

公開資料稱在許多高難任務上相較 GPT-5.2 使用更少 tokens。

模型對比

GPT-5.4 與前沿模型（定性）

面向選型決策的快速對照；扣費與可用性以 LimaxAI 價格頁與模型列表為準，非實時價目。

Claude Opus 4.6、Gemini 3.1 Pro 為公開對比中常見的對標型號；上下文與單次輸出上限隨版本變化。

維度	GPT-5.4	Claude Opus 4.6	Gemini 3.1 Pro
上下文窗口	1.05M	200K（1M beta）	1M
最大輸出	128K	128K	64K
原生 Computer Use	是	否	否
Tool Search	是	否	否
推理控制	none 至 xhigh	standard / extended	公開控制項有限

應用場景

你可以用 GPT-5.4 構建什麼

下列場景與公開產品資料中的 GPT-5.4 敘事一致；配圖為概念示意。

可操作瀏覽器與桌面的自主 Agent

構建能點選、輸入、瀏覽並完成多步驟界面任務的 Agent；藉助原生 Computer Use 驗證工作流後再上線。

完整代碼庫與長文檔分析

在單次請求中處理完整倉庫、長政策或大型研究材料，適合架構審閱與依賴分析。

企業工具生態的 Tool Search 編排

依賴大量內部 API、工具或 MCP 連接器時，讓模型按需選擇正確工具，減少無效 token 浪費。

基準表現

基準對比：GPT-5.4 vs GPT-5.2

公開基準展示 GPT-5.4 在專業任務、工具使用、網頁瀏覽與 computer use 上的提升；僅供參考。

基準項	GPT-5.4	GPT-5.2
GDPval	83.0%	70.9%
SWE-Bench Pro	57.7%	55.6%
OSWorld（人類 72.4%）	75.0%	47.3%
BrowseComp	82.7%	65.8%
每聲明事實錯誤率	少 33%	基線

平台價值

為什麼在 LimaxAI 裡用

與站內其他對話模型共用聊天體驗，無需為單一模型單獨維護密鑰或控制檯。

統一的聊天工作臺

在模型列表中切換 GPT-5.4 與 Claude、Gemini 等模型，歷史與附件能力以目前版本為準。

積分計費一體化

按 LimaxAI 公示的聊天計費與積分規則扣減，便於與團隊內其他模型對比成本。

流式輸出與現有客戶端一致

沿用 LimaxAI 聊天已對接的流式管線，適合長回覆與迭代式調試。

接入步驟

如何開始

從註冊到生產監控，三步上手。

登入 LimaxAI
註冊並進入對話頁，在模型列表中查找 GPT-5.4 或名稱相近的條目。
發送第一條請求
用自然語言描述任務，必要時附上代碼片段、截圖或工具說明；複雜任務可逐步提高 reasoning effort（若產品內提供）。
迭代並擴展
結合價格頁與用量明細控制成本；滿意後將工作流推廣到團隊或 Agent 管線。

常見問答

常見問題

在 LimaxAI 裡如何選用 GPT-5.4？

進入「對話」頁，在模型下拉列表中選擇帶 GPT-5.4 字樣的條目。列表由後端接口下發，名稱與可見性會隨營運配置變化。

GPT-5.4 和 GPT-5.2 有什麼區別？

公開資料稱 GPT-5.4 上下文約為 GPT-5.2 的 2.6 倍，並新增原生 Computer Use 與 Tool Search，在許多高難任務上 token 效率更高。

什麼是原生 Computer Use？

模型可根據截圖與鍵鼠動作直接操作界面，包括瀏覽網站與完成多步驟交互，而不必額外接專用 computer-use 模型。

什麼是 Tool Search？

讓模型從更大工具集中自動發現並選擇合適工具，而不是在每次 prompt 中嵌入全部工具定義，有助於提升 Agent 品質並節省 token。

上下文很大，是否每次都能貼整倉？

1.05M 是能力上限；實際仍可能受請求體大小、附件策略、風控與限流影響。遇到失敗時應拆分或精簡輸入。

對話積分如何計費？

按所選聊天模型與 LimaxAI 公示的積分規則計費；以價格頁與個人消費明細為準。

在 LimaxAI 對話中試用

用真實任務試一條 GPT-5.4

打開聊天，在模型列表中選擇 GPT-5.4，從編碼、長文檔或 Agent 草稿開始驗證。

進入對話返回首頁