GPT-5.4

GPT-5.4: inbyggd Computer Use, Verktygssökning och mycket lång kontext

Byggd för produktionsagenter och kodningssystem: bearbeta hela repon eller boklånga dokument i en begäran, finjustera resonemang från inget till xhigh och använd samma chattarbetsyta som andra frontmodeller.

1,05M kontext
128K max utdata
Inbyggd Computer Use
Verktygssökning
Justerbart resonemang

> tool_search("browser.navigate")

// Computer Use · screenshot + action

> context: 1.05M tokens · output budget: 128K

// reasoning: high · tools: 42 matched

Förmågor

Nyckelförmågor

Höjdpunkter från offentliga GPT-5.4-material; exakta reglage beror på vad chatten exponerar.

1,05M-kontextfönster

Få plats med hela kodbaser, långa policyer eller stora forskningskorpusar i en begäran.

128K max utdata

Generera fullständiga rapporter, långa implementationer eller stora strukturerade utdata i ett pass.

Inbyggd Computer Use

Styr gränssnitt via skärmdumpar och tangentbords-/mushändelser – stark på flerstegs webbläsare och skrivbordsuppgifter (publikt OSWorld 75,0 %).

Verktygssökning

Upptäck och anropa rätt verktyg vid behov i stället för att stoppa in varje verktygsdefinition i varje prompt.

Justerbart resonemang

Välj resonemangsinsats från inget till xhigh för att balansera latens, djup och kostnad.

Högre token-effektivitet

Offentliga material anger färre token än GPT-5.2 på många hårda uppgifter.

Jämförelse

Hur GPT-5.4 jämförs (kvalitativt)

Snabb köpar-tabell; fakturering och tillgänglighet följer prissidan och modellistan.

Claude Opus 4.6 och Gemini 3.1 Pro är vanliga publika benchmarks; gränser ändras per release.

Dimension	GPT-5.4	Claude Opus 4.6	Gemini 3.1 Pro
Kontextfönster	1,05M	200K (1M beta)	1M
Max utdata	128K	128K	64K
Inbyggd Computer Use	Ja	Nej	Nej
Verktygssökning	Ja	Nej	Nej
Resonemangskontroller	inget till xhigh	standard / utökat	Begränsade offentliga reglage

Användningsfall

Vad du kan bygga

Typiska arbetsflöden i linje med offentlig GPT-5.4-positionering; bilder är illustrativa.

Självgående webbläsar- och skrivbordsagenter

Agenter som klickar, skriver, surfar och slutför flerstegs UI-flöden – validera med inbyggd Computer Use före produktion.

Hel-repo och lång dokumentanalys

Arkitekturgranskningar, beroenderevisioner och forskningssyntes inom ett brett fönster.

Verktygssökning för företagsstackar

Orkestrera många interna API:er, verktyg eller MCP-kopplingar utan att blåsa upp varje prompt med verktygsscheman.

Benchmarks

Benchmarks: GPT-5.4 kontra GPT-5.2

Publika benchmark-ögonblicksbilder; ingen garanti för resultat på er arbetsbelastning.

Benchmark	GPT-5.4	GPT-5.2
GDPval	83,0 %	70,9 %
SWE-Bench Pro	57,7 %	55,6 %
OSWorld (människa 72,4 %)	75,0 %	47,3 %
BrowseComp	82,7 %	65,8 %
Faktafel per påstående	33 % färre	Baslinje

Fördelar med plattformen

Varför använda det här

Samma chattupplevelse som andra frontmodeller – ingen separat konsol per leverantör.

En chattyta

Växla mellan GPT-5.4, Claude, Gemini med mera i modellistan.

Enhetliga poäng

Fakturera enligt poängregler så team kan jämföra modeller på riktiga uppgifter.

Strömnings-UX

Samma strömmande chattpipeline som övriga modeller för långa svar och iteration.

Kom igång

Kom igång i tre steg

Från inloggning till produktionsiteration.

Logga in
Öppna Chat och välj GPT-5.4 (eller närmast matchande namn) i modellistan.
Skicka din första prompt
Beskriv uppgiften; bifoga kod, skärmdumpar eller verktygsanteckningar. Höj resonemang när gränssnittet erbjuder det.
Iterera och skala
Följ användning på prissidan, lyft sedan arbetsflödet till kollegor eller agenter.

Vanliga frågor

Hur väljer jag GPT-5.4?

Öppna Chat och välj GPT-5.4 i modellistan. Namn och synlighet kommer från backendkonfiguration och kan ändras.

Hur skiljer sig GPT-5.4 från GPT-5.2?

Offentliga material anger ~2,6× kontext mot GPT-5.2, plus inbyggd Computer Use och Verktygssökning, och bättre token-effektivitet på många hårda uppgifter.

Vad är inbyggd Computer Use?

Modellen kan agera på skärmdumpar och UI-händelser för att surfa och slutföra flerstegsinteraktioner utan separat computer-use-stack.

Vad är Verktygssökning?

Den väljer verktyg ur en större katalog vid behov i stället för att bädda in varje definition i varje prompt – bättre agentkvalitet, färre bortkastade token.

Kan jag klistra in hela repot varje gång?

1,05M är en övre gräns; gateway-gränser, bilagor, moderering eller rate limits kan fortfarande gälla. Dela upp arbetet när gränssnittet varnar.

Hur faktureras chatpoäng?

Enligt poängregler för vald chatmodell; se prissidan och användningshistoriken.

Prova GPT-5.4 i chatten

Kör en riktig uppgift på GPT-5.4

Öppna Chat, välj GPT-5.4 och börja med kodning, långa dokument eller ett agentutkast.

Öppna chatt Tillbaka till startsidan