OpenAI heeft donderdag zijn antwoord vrijgegeven op het indrukwekkende Gemini 3 Pro-model van Google–GPT-5.2– en zoals blijkt uit enkele onderlinge benchmarktestscores, lijkt het een winnaar. Het nieuwe model behaalde de hoogste score op een aantal benchmarktests op het gebied van coderen, wiskunde, wetenschap, gereedschapsgebruik en visie. (Benchmarks moeten uiteraard worden gecombineerd met gebruik in de praktijk om het hele verhaal te vertellen. Maar toch…)
OpenAI zegt dat GPT-5.2, een redeneermodel, prestatiescores op expertniveau behaalde op zijn eigen GDPval-benchmark, die de prestaties evalueert op 44 echte professionele taken, waaronder zaken als het maken van spreadsheets, het opstellen van documenten, het bouwen van presentaties en meer.
GPT-5.2 stond bovenaan Gemini 3 Pro in de SWE-Bench Pro benchmark (software-engineeringtaken) met een score van 55,6% (versus Gemini 3 Pro’s 43,3%). Het behaalde een score van 86,2% op de ARC-AGI-1-benchmark voor abstract redeneren, vergeleken met de score van 75% in Gemini 3 Pro. Het scoorde een score van 92,4% op de GPQA Diamond-benchmark (wetenschappelijke vragen), vergeleken met de score van 91,9% in Gemini 3 Pro.
Het nieuwe model is verkrijgbaar in drie varianten. GPT-5.2 Instant is goed voor het zoeken naar informatie en how-to’s, het opbouwen van vaardigheden en studie, en loopbaanbegeleiding. GPT-5.2 Thinking is goed voor zwaardere professionele taken, zoals het opmaken van spreadsheets en het maken van diavoorstellingen. Het bedrijf zegt dat GPT-5.2 Pro meer tijd nodig heeft om antwoorden te genereren, maar het is het “slimste en meest betrouwbare” model voor het genereren van nauwkeurige antwoorden in complexe domeinen zoals programmeren.
Voor de vele ontwikkelaars die nu agents ontwikkelen, zegt OpenAI dat GPT-5.2 met redenering het sterkste aanbod tot nu toe is, met “significante verbeteringen op het gebied van algemene intelligentie, begrip van lange contexten, agentic tool-calling en visie.”
OpenAI zou naar verluidt hebben aangedrongen om GPT-5.2 vóór het einde van het jaar uit te brengen, zodat het de release van Google’s Gemini 3 zou kunnen tegengaan. Het bedrijf bracht GPT-5 in augustus uit en luidde het in als de volgende grote sprong voorwaarts in zijn carrière. AI onderzoek. GPT-5 was een ‘systeem’ van modellen, waarbij gebruik werd gemaakt van een ‘router’ om de juiste vragen naar gespecialiseerde modellen te sturen. Het verwijst naar GPT-5.2 als een “uniform systeem dat automatisch kiest hoe te reageren op basis van de complexiteit van de taak.”
De verhoogde capaciteit van het GPT-5.2-model voor het verwerken en redeneren van multimodale invoer (audio, video, afbeeldingen, tekst, enz.) is aanzienlijk, omdat Google Gemini 3 dit heel goed doet.
Het nieuwe model werd bijvoorbeeld gevraagd om de kenmerken van een afbeelding van een printplaat te analyseren en vervolgens alle kleine componenten te identificeren en te labelen. OpenAI zegt dat GPT-5.2 dit met veel meer details en nauwkeurigheid deed dan zijn eerdere GPT-5.1-model dat kon. Wanneer het redeneren wordt geïntroduceerd, kan het model mogelijk problemen in mechanische systemen diagnosticeren door de visuele signalen te herkennen.
Alle drie de varianten van GPT-5.2 zijn vandaag beschikbaar in ChatGPT, te beginnen met betaalde abonnees en beschikbaar voor ontwikkelaars via de API. Microsoft, een grote investeerder in OpenAI, zegt dat het GPT-5.2 vandaag naar Microsoft 365 Copilot- en Copilot Studio-gebruikers wereldwijd brengt.
In gerelateerd nieuws kondigde OpenAI ook aan dat het een licentie had verkregen omgaan met Disney waarmee Sora 2-gebruikers Disney-personages kunnen gebruiken in afbeeldingen die ze genereren en delen met behulp van de app. Daarnaast zal Disney een aandeleninvestering van $1 miljard doen in OpenAI, met een optie om in de toekomst meer aandelen te kopen.


