1.05M 上下文窗口
單次請求可容納完整代碼倉庫、長篇政策或研究材料級別的輸入。
GPT-5.4
面向生產級 Agent 與編碼系統:在單次請求中處理完整代碼庫或長文檔,支援可調推理強度(none 至 xhigh),並在 LimaxAI 聊天中與站內其他前沿模型共用同一工作臺。
> tool_search("browser.navigate")
// Computer Use · screenshot + action
> context: 1.05M tokens · output budget: 128K
// reasoning: high · tools: 42 matched
核心能力
參考公開產品資料整理的 GPT-5.4 能力要點;具體開關與參數以 LimaxAI 聊天內實際展示為準。
單次請求可容納完整代碼倉庫、長篇政策或研究材料級別的輸入。
一次響應可生成完整報告、長實現或大段結構化內容。
通過截圖與鍵鼠指令操作界面,適合瀏覽器與桌面應用程式的多步驟任務(公開基準 OSWorld 75.0%)。
從更大工具生態中按需發現與調用,避免每次 prompt 塞滿全部工具定義。
按延遲、深度與任務難度在 none 到 xhigh 之間選擇 reasoning effort。
公開資料稱在許多高難任務上相較 GPT-5.2 使用更少 tokens。
模型對比
面向選型決策的快速對照;扣費與可用性以 LimaxAI 價格頁與模型列表為準,非實時價目。
Claude Opus 4.6、Gemini 3.1 Pro 為公開對比中常見的對標型號;上下文與單次輸出上限隨版本變化。
| 維度 | GPT-5.4 | Claude Opus 4.6 | Gemini 3.1 Pro |
|---|---|---|---|
| 上下文窗口 | 1.05M | 200K(1M beta) | 1M |
| 最大輸出 | 128K | 128K | 64K |
| 原生 Computer Use | 是 | 否 | 否 |
| Tool Search | 是 | 否 | 否 |
| 推理控制 | none 至 xhigh | standard / extended | 公開控制項有限 |
應用場景
下列場景與公開產品資料中的 GPT-5.4 敘事一致;配圖為概念示意。
構建能點選、輸入、瀏覽並完成多步驟界面任務的 Agent;藉助原生 Computer Use 驗證工作流後再上線。
在單次請求中處理完整倉庫、長政策或大型研究材料,適合架構審閱與依賴分析。
依賴大量內部 API、工具或 MCP 連接器時,讓模型按需選擇正確工具,減少無效 token 浪費。
基準表現
公開基準展示 GPT-5.4 在專業任務、工具使用、網頁瀏覽與 computer use 上的提升;僅供參考。
| 基準項 | GPT-5.4 | GPT-5.2 |
|---|---|---|
| GDPval | 83.0% | 70.9% |
| SWE-Bench Pro | 57.7% | 55.6% |
| OSWorld(人類 72.4%) | 75.0% | 47.3% |
| BrowseComp | 82.7% | 65.8% |
| 每聲明事實錯誤率 | 少 33% | 基線 |
平台價值
與站內其他對話模型共用聊天體驗,無需為單一模型單獨維護密鑰或控制檯。
在模型列表中切換 GPT-5.4 與 Claude、Gemini 等模型,歷史與附件能力以目前版本為準。
按 LimaxAI 公示的聊天計費與積分規則扣減,便於與團隊內其他模型對比成本。
沿用 LimaxAI 聊天已對接的流式管線,適合長回覆與迭代式調試。
接入步驟
從註冊到生產監控,三步上手。
註冊並進入對話頁,在模型列表中查找 GPT-5.4 或名稱相近的條目。
用自然語言描述任務,必要時附上代碼片段、截圖或工具說明;複雜任務可逐步提高 reasoning effort(若產品內提供)。
結合價格頁與用量明細控制成本;滿意後將工作流推廣到團隊或 Agent 管線。
常見問答
進入「對話」頁,在模型下拉列表中選擇帶 GPT-5.4 字樣的條目。列表由後端接口下發,名稱與可見性會隨營運配置變化。
公開資料稱 GPT-5.4 上下文約為 GPT-5.2 的 2.6 倍,並新增原生 Computer Use 與 Tool Search,在許多高難任務上 token 效率更高。
模型可根據截圖與鍵鼠動作直接操作界面,包括瀏覽網站與完成多步驟交互,而不必額外接專用 computer-use 模型。
讓模型從更大工具集中自動發現並選擇合適工具,而不是在每次 prompt 中嵌入全部工具定義,有助於提升 Agent 品質並節省 token。
1.05M 是能力上限;實際仍可能受請求體大小、附件策略、風控與限流影響。遇到失敗時應拆分或精簡輸入。
按所選聊天模型與 LimaxAI 公示的積分規則計費;以價格頁與個人消費明細為準。
在 LimaxAI 對話中試用
打開聊天,在模型列表中選擇 GPT-5.4,從編碼、長文檔或 Agent 草稿開始驗證。