1,05M-kontextfönster
Få plats med hela kodbaser, långa policyer eller stora forskningskorpusar i en begäran.
GPT-5.4
Byggd för produktionsagenter och kodningssystem: bearbeta hela repon eller boklånga dokument i en begäran, finjustera resonemang från inget till xhigh och använd samma chattarbetsyta som andra frontmodeller.
> tool_search("browser.navigate")
// Computer Use · screenshot + action
> context: 1.05M tokens · output budget: 128K
// reasoning: high · tools: 42 matched
Förmågor
Höjdpunkter från offentliga GPT-5.4-material; exakta reglage beror på vad chatten exponerar.
Få plats med hela kodbaser, långa policyer eller stora forskningskorpusar i en begäran.
Generera fullständiga rapporter, långa implementationer eller stora strukturerade utdata i ett pass.
Styr gränssnitt via skärmdumpar och tangentbords-/mushändelser – stark på flerstegs webbläsare och skrivbordsuppgifter (publikt OSWorld 75,0 %).
Upptäck och anropa rätt verktyg vid behov i stället för att stoppa in varje verktygsdefinition i varje prompt.
Välj resonemangsinsats från inget till xhigh för att balansera latens, djup och kostnad.
Offentliga material anger färre token än GPT-5.2 på många hårda uppgifter.
Jämförelse
Snabb köpar-tabell; fakturering och tillgänglighet följer prissidan och modellistan.
Claude Opus 4.6 och Gemini 3.1 Pro är vanliga publika benchmarks; gränser ändras per release.
| Dimension | GPT-5.4 | Claude Opus 4.6 | Gemini 3.1 Pro |
|---|---|---|---|
| Kontextfönster | 1,05M | 200K (1M beta) | 1M |
| Max utdata | 128K | 128K | 64K |
| Inbyggd Computer Use | Ja | Nej | Nej |
| Verktygssökning | Ja | Nej | Nej |
| Resonemangskontroller | inget till xhigh | standard / utökat | Begränsade offentliga reglage |
Användningsfall
Typiska arbetsflöden i linje med offentlig GPT-5.4-positionering; bilder är illustrativa.
Agenter som klickar, skriver, surfar och slutför flerstegs UI-flöden – validera med inbyggd Computer Use före produktion.
Arkitekturgranskningar, beroenderevisioner och forskningssyntes inom ett brett fönster.
Orkestrera många interna API:er, verktyg eller MCP-kopplingar utan att blåsa upp varje prompt med verktygsscheman.
Benchmarks
Publika benchmark-ögonblicksbilder; ingen garanti för resultat på er arbetsbelastning.
| Benchmark | GPT-5.4 | GPT-5.2 |
|---|---|---|
| GDPval | 83,0 % | 70,9 % |
| SWE-Bench Pro | 57,7 % | 55,6 % |
| OSWorld (människa 72,4 %) | 75,0 % | 47,3 % |
| BrowseComp | 82,7 % | 65,8 % |
| Faktafel per påstående | 33 % färre | Baslinje |
Fördelar med plattformen
Samma chattupplevelse som andra frontmodeller – ingen separat konsol per leverantör.
Växla mellan GPT-5.4, Claude, Gemini med mera i modellistan.
Fakturera enligt poängregler så team kan jämföra modeller på riktiga uppgifter.
Samma strömmande chattpipeline som övriga modeller för långa svar och iteration.
Kom igång
Från inloggning till produktionsiteration.
Öppna Chat och välj GPT-5.4 (eller närmast matchande namn) i modellistan.
Beskriv uppgiften; bifoga kod, skärmdumpar eller verktygsanteckningar. Höj resonemang när gränssnittet erbjuder det.
Följ användning på prissidan, lyft sedan arbetsflödet till kollegor eller agenter.
Vanliga frågor
Öppna Chat och välj GPT-5.4 i modellistan. Namn och synlighet kommer från backendkonfiguration och kan ändras.
Offentliga material anger ~2,6× kontext mot GPT-5.2, plus inbyggd Computer Use och Verktygssökning, och bättre token-effektivitet på många hårda uppgifter.
Modellen kan agera på skärmdumpar och UI-händelser för att surfa och slutföra flerstegsinteraktioner utan separat computer-use-stack.
Den väljer verktyg ur en större katalog vid behov i stället för att bädda in varje definition i varje prompt – bättre agentkvalitet, färre bortkastade token.
1,05M är en övre gräns; gateway-gränser, bilagor, moderering eller rate limits kan fortfarande gälla. Dela upp arbetet när gränssnittet varnar.
Enligt poängregler för vald chatmodell; se prissidan och användningshistoriken.
Prova GPT-5.4 i chatten
Öppna Chat, välj GPT-5.4 och börja med kodning, långa dokument eller ett agentutkast.