OpenAI heeft donderdag zijn meest capabele versie uitgebracht AI systeem, GPT-5.5, waarvan het bedrijf zegt dat het een krachtigere Codex-coderingsagent mogelijk zal maken. OpenAI zegt echter snel dat GPT-5.5 de groeiende reeks algemene digitale werktaken zal aandrijven Codex in staat is. Het systeem is aanzienlijk beter dan eerdere releases in het helpen bij wetenschappelijk werk, inclusief de creatieve aspecten van het genereren van nieuwe hypothesen en het testen ervan.
Het systeem vertegenwoordigt een verbetering van het autonome of agentische vermogen. GPT-5.5 “vertegenwoordigt een stap in de richting van AI-systemen die complexe, uit meerdere stappen bestaande taken op een computer kunnen voltooien zonder menselijke begeleiding”, zegt OpenAI in een blogpost.
GPT-5.5 scoort volgens OpenAI beter dan enig ander AI-systeem op de Terminal-Bench 2.0-benchmark, die test op complexe opdrachtregelworkflows die planning, iteratie en toolcoördinatie vereisen. Het behaalde een score van 82,7%, wat een duidelijke voorsprong toont op de score van GPT-5.4 van 75,1%, de score van Anthropic’s Opus 4.7 van 69,4% en Google’s Gemini 3.1 Pro’s score van 68,5%. Op OSWorld-Verified, dat meet of een model zelfstandig een computer kan bedienen, scoort het 78,7%, tegenover 75% voor GPT-5.4 en 78% voor Anthropic’s Opus 4.7.
Antropisch’s nieuwste grensmodel, genaamd Mythosis klaar maar is nog niet publiekelijk vrijgegeven.
OpenAI zegt dat het een toename van het aantal gebruikers voor zijn Codex-coderingsagent heeft gezien, waarbij ongeveer 4 miljoen ontwikkelaars de tool wekelijks gebruiken. Tijdens een gesprek met de pers zei Greg Brockman, president van OpenAI, dat GPT-5.5 Codex in staat zal stellen om gepolijste code te produceren en codeerprojecten uit te voeren met het oordeel van een senior software-ingenieur.
OpenAI positioneert GPT-5.5 als het sterkste codeermodel. Op SWE-Bench Pro, een benchmark die de oplossing van GitHub-problemen in de echte wereld meet, wordt 58,6% van de taken end-to-end in één keer opgelost. Ontwikkelaars die het systeem al vroeg hebben getest, zeiden dat GPT-5.5 een beter begrip heeft van de ‘vorm’ van een softwaresysteem, en beter kan begrijpen waarom iets faalt, waar de oplossing nodig is en wat er nog meer in de codebasis zou worden beïnvloed.
De GPT-5.5-release komt slechts enkele weken na de release van het GPT-5.4-systeem. OpenAI staat onder druk om gelijke tred te houden met zijn rivaal Anthropic, vooral op het gebied van AI-codeerassistenten, die tot nu toe de grootste impact van AI op de bedrijfsvoering zijn gebleken. Het tempo van de systeemreleases neemt toe omdat de AI zelf een groot deel van het zware werk doet bij het coderen van de AI-systemen zelf.
Sommigen hebben gespeculeerd dat het nieuwe OpenAI-model wel 10 biljoen parameters zou kunnen omvatten, maar Brockman weigerde dit te zeggen.
GPT-5.5 wordt uitgerold naar OpenAI’s Plus-, Pro-, Business- en Enterprise-abonnementsgebruikers in ChatGPT en Codex. GPT-5.5 Pro, een versie met een hogere nauwkeurigheid, is beschikbaar voor Pro-, Business- en Enterprise-gebruikers.



