Home Nieuws OpenAI’s GPT-5.3-Codex denkt dieper en breder na over codeerwerk

OpenAI’s GPT-5.3-Codex denkt dieper en breder na over codeerwerk

1
0
OpenAI’s GPT-5.3-Codex denkt dieper en breder na over codeerwerk

Donderdag werd OpenAI vrijgegeven GPT-5.3-Codexeen nieuw model dat de Codex-coderingsagent uitbreidt van het schrijven en beoordelen van code naar het uitvoeren van een veel breder scala aan werktaken. De release komt terwijl de concurrentie tussen de spelers blijft toenemen kunstmatige intelligentie bedrijven die strijden om marktaandeel op het gebied van door AI aangedreven codeertools.

OpenAI zegt dat GPT-5.3 de codeerprestaties van GPT-5.2-Codex combineert met de redeneer- en professionele kennismogelijkheden van GPT-5.2, terwijl het 25% sneller werkt. Hierdoor kan GPT-5.3-Codex langlopende taken uitvoeren die onderzoek, het gebruik van tools zoals zoeken op internet of databaseoproepen, en complexe uitvoering en planning voor zowel algemene werktaken als softwareontwikkeling met zich meebrengen.

Codex heeft meer dan 1 miljoen ontwikkelaars bereikt, beweert OpenAI. En hoewel de Claude Code van Anthropic ook snel is toegepast, blijven de gegevens die de twee tools met elkaar vergelijken, schaars. Semi-analyse rapporten dat 4% van de publieke commits van GitHub, of nieuwe code die naar repositories wordt geüpload, momenteel wordt geschreven door Claude Code, en er wordt verwacht dat dit cijfer tegen eind 2026 20% of meer zou kunnen bereiken.

Benchmark one-upmanship

OpenAI zegt dat GPT-5.3-Codex nu de beste score heeft van elk model op SWE-Bench Pro, een benchmark die software-engineering in de echte wereld in vier programmeertalen evalueert. Hetzelfde geldt voor Terminal-Bench 2.0, dat meet welke terminalvaardigheden codeeragenten nodig hebben.

Anthropic zegt dat het nieuw is Claude Opus 4.6-modeleveneens donderdag aangekondigd, behaalde topscores op verschillende branchebenchmarks, waaronder Humanity’s Last Exam (complex multidisciplinair redeneren), GDPval-AA (economisch waardevol kenniswerk) en BrowseComp (moeilijk te vinden informatie zoeken).

OpenAI zegt dat zijn nieuwe model in staat is om rekening te houden met grotere hoeveelheden informatie tijdens het werken aan een taak, en om langere tijd over die taken na te denken zonder menselijke tussenkomst. Tijdens het testen zegt OpenAI dat het GPT-5.3-Codex autonoom de game-ontwikkeling heeft zien herhalen over miljoenen tokens met behulp van generieke aanwijzingen zoals ‘repareer de bug’ of ‘verbeter het spel’.

Op dezelfde manier zegt Anthropic dat het nieuwe Opus 4.6-model grotere codebases kan begrijpen en doordachtere beslissingen kan nemen over hoe nieuwe code moet worden toegevoegd.

OpenAI zegt dat GPT-5.3-Codex is gebouwd om de volledige levenscyclus van software te ondersteunen, inclusief het debuggen, implementeren en monitoren van code, evenals het schrijven van productvereistendocumenten en het uitvoeren van onderzoek.

Van coderen naar kenniswerk

Dezelfde agentische mogelijkheden die de codeervaardigheid van Codex vergroten, kunnen van toepassing zijn op taken die ver buiten het domein van softwareontwikkeling vallen, zegt OpenAI, en zich uitstrekken tot functies zoals het maken van diapresentaties en het analyseren van gegevens in spreadsheets.

Op GDPval, een OpenAI-evaluatie die de prestaties meet op goed gespecificeerde kenniswerktaken in 44 beroepen, komt GPT-5.3-Codex overeen met GPT-5.2 terwijl er sterkere codeermogelijkheden worden toegevoegd. Op OSWorld-Verified, dat computergebruik in een visuele desktopomgeving test, behaalde GPT-5.3-Codex een nauwkeurigheid van 64,7%, vergeleken met 38,2% voor zijn voorganger.

Anthropic heeft zijn Claude Code-tool in dezelfde richting gestuurd: om een ​​bredere groep informatiewerkers te helpen met een veel bredere reeks zakelijke taken.

GPT-5.3-Codex is het eerste model dat OpenAI classificeert als “hoge capaciteit” voor cybersecurity-gerelateerde taken onder zijn Preparedness Framework, en het eerste dat het bedrijf rechtstreeks heeft getraind om softwarekwetsbaarheden te identificeren. OpenAI heeft 10 miljoen dollar aan API-kredieten (Application Programming Interface) beschikbaar gesteld om de cyberverdediging te versnellen, met name voor open-sourcesoftware en kritieke infrastructuursystemen.

GPT-5.3-Codex is nu beschikbaar voor betalende ChatGPT-abonnees in de Codex-app, in de opdrachtregelinterface, als IDE-extensie en op internet. OpenAI zegt dat het eraan werkt om binnenkort API-toegang (gebruikt door ondernemingen en onafhankelijke ontwikkelaars) tot het model mogelijk te maken.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in