105万コンテキスト窓
フルコードベース、長いポリシー、大きな研究コーパスを一リクエストに。
GPT-5.4
本番エージェントとコーディング系向け——一リクエストでリポ全体や書籍級ドキュメントを処理し、推論 effort はなしから xhigh まで。他フロンティアと同じ LimaxAI チャットで。
> tool_search("browser.navigate")
// Computer Use · screenshot + action
> context: 1.05M tokens · output budget: 128K
// reasoning: high · tools: 42 matched
機能
公開 GPT-5.4 のハイライト。実トグルは LimaxAI チャットに従ってください。
フルコードベース、長いポリシー、大きな研究コーパスを一リクエストに。
長いレポート、大規模実装、大きな構造化出力を一括で。
スクリーンショットとキーボード/マウス操作で UI を操作——ブラウザとデスクトップの多段タスクに強く、公開 OSWorld 75.0% のストーリー。
毎プロンプトに全ツール定義を詰め込まず、必要なツールをオンデマンドで発見・呼び出し。
なしから xhigh まで選び、レイテンシ·深さ·コストを調整。
公開資料では、多くの難しいタスクで GPT-5.2 より少ないトークンで済むと報告されています。
比較
購入判断の早見。課金と可否は LimaxAI 料金とモデル一覧です。
Claude Opus 4.6 と Gemini 3.1 Pro は一般的な公開ベンチ。版ごとに上限は変わります。
| 観点 | GPT-5.4 | Claude Opus 4.6 | Gemini 3.1 Pro |
|---|---|---|---|
| コンテキスト窓 | 105万 | 200K(100万ベータ) | 100万 |
| 最大出力 | 128K | 128K | 64K |
| ネイティブ コンピュータ操作 | あり | なし | なし |
| ツール検索 | あり | なし | なし |
| 推論コントロール | なし〜xhigh | 標準 / 拡張 | 公開コントロールは限定的 |
ユースケース
公開 GPT-5.4 の典型ワークフロー。ビジュアルはイメージです。
クリック、入力、ブラウズで多段 UI フローを完了——本番前にネイティブ コンピュータ操作 で検証。
広い窓の中でアーキレビュー、依存監査、研究統合。
多数の内部 API、ツール、MCP コネクタを、毎回スキーマでパンクさせずに編成。
ベンチマーク
公開スナップショット——自ワークロードでの保証ではありません。
| ベンチマーク | GPT-5.4 | GPT-5.2 |
|---|---|---|
| GDPval | 83.0% | 70.9% |
| SWE-Bench Pro | 57.7% | 55.6% |
| OSWorld(人間 72.4%) | 75.0% | 47.3% |
| BrowseComp | 82.7% | 65.8% |
| 主張あたりの事実誤り | 33% 減 | ベースライン |
LimaxAI でのメリット
他フロンティアと同じチャット——ベンダ毎の別コンソールなし。
GPT-5.4 と Claude、Gemini などを一覧から切替。
LimaxAI ポイントで実タスク比較。
長文と反復も同じストリーミング配管。
はじめに
サインインから本番反復まで。
チャットを開きドロップダウンから GPT-5.4(または近い表記)を選択。
タスクを説明し、コード·スクリーンショット·ツール注記を添付。UI が提案するなら推論を上げる。
料金ページで利用を見てから同僚やエージェントへ展開。
よくある質問
チャットのモデル一覧から GPT-5.4 を選びます。名称と表示はバックエンド設定で変わり得ます。
公開では GPT-5.2 の約 2.6× 文脈に加えネイティブ コンピュータ操作 と ツール検索、多くの難タスクでトークン効率の改善と説明されています。
スクリーンショットと UI イベントに基づきサイト閲覧など多段操作を、別 コンピュータ操作 スタックなしで行えます。
大きいカタログから都度ツールを選び呼び出す方式で、毎プロンプト全定義を載せずに済み、品質とトークン浪費のバランスが良くなります。
105万は上限です。ゲートウェイ上限、添付、モデレーション、レート制限は残り得ます。UI が注意したら分割を。
選択モデルの LimaxAI ポイントルールに従います。料金ページと履歴を参照。
チャットで GPT-5.4
チャットで GPT-5.4 を選び、コーディング、長文、エージェント草案から。