Home Nieuws Enterprise AI-codering laat tanden groeien: GPT-5.2-Codex verweeft beveiliging in grootschalige softwarerefactors

Enterprise AI-codering laat tanden groeien: GPT-5.2-Codex verweeft beveiliging in grootschalige softwarerefactors

4
0
Enterprise AI-codering laat tanden groeien: GPT-5.2-Codex verweeft beveiliging in grootschalige softwarerefactors

Met de recente release van GPT 5.2heeft OpenAI andere gerelateerde modellen bijgewerkt, waaronder het populaire codeermodel Codex, waardoor er meer agentische gebruiksscenario’s zijn ontstaan.

GPT-5.2-Codex, die OpenAI noemt in een blogpost “het meest geavanceerde agentische coderingsmodel tot nu toe voor complexe, real-world software-ingenieurs”, is geoptimaliseerd voor langdurig werk met agenten en zal over sterkere cyberbeveiligingsmogelijkheden beschikken.

Het model is een uitloper van GPT-5.2, geoptimaliseerd voor agentisch bouwen.

“GPT-5.2-Codex vertegenwoordigt een stap voorwaarts in de manier waarop geavanceerde AI software-engineering in de echte wereld en gespecialiseerde domeinen zoals cybersecurity kan ondersteunen, waardoor ontwikkelaars en verdedigers complexe werkzaamheden op lange termijn kunnen aanpakken en de tools kunnen versterken die beschikbaar zijn voor verantwoord beveiligingsonderzoek”, aldus het bedrijf in zijn blogpost.

Bedrijven hebben toegang tot het nieuwe Codex-model “op alle Codex-oppervlakken voor betaalde ChatGPT-gebruikers, en werken eraan om de komende weken veilig toegang tot GPT-5.2-Codex voor API-gebruikers mogelijk te maken.” Het bedrijf voert ook een pilot uit met vertrouwde gebruikers die alleen op uitnodiging toegang krijgen tot ‘meer tolerante modellen voor doorgelichte professionals en organisaties’ voor defensief cyberbeveiligingswerk om een ​​evenwicht te vinden tussen toegankelijkheid en veiligheid.

Vooruitgang op het gebied van cyberbeveiliging met modellen

OpenAI noemt GPT-5.2-Codex het sterkste cyberbeveiligingsmodel tot nu toe. Maar naarmate de capaciteiten toenemen, zegt het bedrijf dat het een implementatieaanpak moet ontwerpen die rekening houdt met toekomstige groei en defensieve cyberbeveiliging ondersteunt.

“Terwijl onze modellen zich blijven ontwikkelen langs de intelligentiegrens, hebben we gemerkt dat deze verbeteringen zich ook vertalen in capaciteitssprongen in gespecialiseerde domeinen zoals cyberbeveiliging”, aldus het bedrijf.

zei Open AI in de systeemkaart dat het het model op drie benchmarks heeft getest: Capture-the-Flag (CTF) evaluaties, CVE-Bench en Cyber ​​Range.

GPT-5.2-Codex werd het best presterende model van het bedrijf op het gebied van CTF-evaluaties, wat ze toeschreven aan compactie, of “de mogelijkheid voor het model om coherent te werken in meerdere contextvensters.”

Het model scoorde 87% in CVE-Bench en presteerde daarmee beter dan andere modellen, waarbij GPT-5.1-Codex-Max op een goede tweede plaats kwam. Deze toename zou nuttig zijn voor taken waarbij opdrachten worden uitgevoerd rond het ontdekken van kwetsbaarheden en het uitproberen van tools ‘met een bijna brute-force-aanpak’.

In de lange Cyber ​​Range-test had het model een gecombineerd slagingspercentage van 72,7%. GPT-5.1-Codex-Max scoorde 81,8%.

Implementatieproject voor cyberbeveiliging

OpenAI zei dat sommige gebruikers van zijn GPT-5.1-Codex-Max, die in november van start gingontdekte een kwetsbaarheid in de broncodeblootstelling in React en rapporteerde dit vervolgens. Volgens OpenAI gebruikte Andrew MacPherson, een beveiligingsonderzoeker bij Privy, GPT-5.1-Codex-Max om te beoordelen hoe goed het model kwetsbaarheidsonderzoek in de echte wereld zou kunnen ondersteunen. Het model bracht in plaats daarvan onverwacht gedrag aan het licht.

Met verbeteringen in de cyberbeveiligingsmogelijkheden voor GPT-5.2-Codex en mogelijk ook voor modellen die daarna komen, zegt OpenAI dat het de inzet van grensmodellen in evenwicht moet brengen met de noodzakelijke hulpmiddelen voor defensieve cyberbeveiliging. Hoewel GPT-5.2-Codex “onder ons Preparedness Framework geen hoog niveau van cybercapaciteiten bereikt”, is het bedrijf van plan geselecteerde gebruikers de beveiligingsmogelijkheden te laten testen. (OpenAI’s Kader voor paraatheid om potentiële schade van AI voor mensen te meten en te volgen)

“Beveiligingsteams kunnen beperkingen tegenkomen wanneer ze proberen bedreigingsactoren te emuleren, malware te analyseren om herstel te ondersteunen, of kritieke infrastructuur te stresstesten. We ontwikkelen een pilot voor vertrouwde toegang om die wrijving voor gekwalificeerde gebruikers en organisaties weg te nemen en vertrouwde verdedigers in staat te stellen grensverleggende AI-cybermogelijkheden te gebruiken om cyberdefensie te versnellen.” zei OpenAI.

Agentische grenzen

GPT-5.2 al kreeg lof van gebruikers voor gebruik in zakelijke taken en workflows. Met de Codex-versie zouden sommige van deze mogelijkheden kunnen worden overgedragen, vooral omdat bedrijven van plan zijn het model te gebruiken om hun agenten te coderen.

Het bedrijf zegt dat het model het werk over de lange horizon verbetert door middel van compactie, en sterke prestaties levert bij uitgebreide codewijzigingen. Het biedt ook verbeterde prestaties op Windows.

Bij benchmarktests presteerde GPT-5.2-Codex het beste op het gebied van nauwkeurigheid vergeleken met de vorige versies.

SWE-Bench Pro
Terminal-Bench 2.0

“Dankzij deze verbeteringen is Codex beter in staat om in grote repository’s te werken gedurende langere sessies met de volledige context intact. Het kan complexe taken zoals grote refactors, codemigraties en feature-builds betrouwbaarder voltooien – en blijft herhalen zonder het overzicht te verliezen, zelfs als plannen veranderen of pogingen mislukken”, aldus OpenAI.

Sinds de lancering in voorproefjes in meiheeft Codex geholpen de acceptatie van agentische en vibe-codering in de AI-bouwerruimte van ondernemingen in te luiden. Samen met Windsurf, Cursor, Claude Code en de vele codeeragenten van Google heeft het platform LLM’s verplaatst van het eenvoudig voltooien van code naar het genereren en starten van asynchrone codeerprojecten voor gebruikers.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in