OpenAI komt dichter bij een van zijn mijlpaaldoelen: systemen die op hetzelfde niveau kunnen functioneren als onderzoeksstagiairs.
In een aflevering van de podcast ‘Unsupervised Learning’ op donderdag zei OpenAI’s hoofdwetenschapper Jakub Pachocki onlangs doorbraken op het gebied van coderenDe vooruitgang op het gebied van wiskundig onderzoek en de vooruitgang in de natuurkunde suggereren dat AI op koers ligt om steeds complexer, uit meerdere stappen bestaand technisch werk af te handelen met minder menselijk toezicht.
“Ik zie dit zeker als een signaal dat er hier iets op de goede weg is”, zei hij.
Hij zei dat de belangrijkste maatstaf is hoe lang een model grotendeels autonoom kan werken.
‘Zoals ik dat zou doen een onderzoeksstagiaire onderscheiden van een volledig geautomatiseerde onderzoeker is de tijdspanne waarin we hem grotendeels autonoom zouden laten werken”, aldus Pachocki, wijzend op een langere taakhorizon als de belangrijkste graadmeter voor vooruitgang.
In oktober schetste Pachocki bij een bedrijf het interne doel van OpenAI om een ”AI-onderzoek stagiair“in september 2026, gevolgd door een volledig autonome AI-onderzoeker in maart 2028.
In een X-post Na de livestream zei Sam Altman, CEO van OpenAI, dat OpenAI “misschien totaal mislukt” in zijn doel, maar dat het belangrijk was om transparant te zijn gezien de potentiële impact.
‘Explosieve groei van codeertools’
Pachocki zei dat het bedrijf al snelle vooruitgang ziet in het soort taken dat belangrijk is voor dat doel, wijzend op codeermiddelen zoals Codex, waarvan hij zei dat ze nu een groot deel van het programmeerwerk van het bedrijf voor hun rekening nemen.
Hij noemde wiskundige benchmarks ook een ‘noordster’ voor het verbeteren van modelredeneringen, omdat ze gemakkelijk te verifiëren zijn.
“We hebben deze explosieve groei van codeertools gezien”, zegt Pachocki. “Voor de meeste mensen is het programmeren behoorlijk veranderd.”
Hij voegde eraan toe dat de uitdaging op de korte termijn zich verschuift naar systemen die dit probleem aankunnen specifieke technische taken met meer autonomie, gebruik meer rekenkracht en werk langer.
“Voor meer specifieke technische ideeën, zoals ik heb een specifiek idee hoe we de modellen kunnen verbeteren, hoe we deze evaluatie anders kunnen uitvoeren, denk ik dat we de stukken hebben die we meestal alleen maar moeten samenstellen”, zei hij.
Toch was Pachocki duidelijk dat AI nog niet klaar is om onafhankelijk te opereren op het niveau van een volwaardige onderzoeker.
“Ik verwacht niet dat we systemen zullen hebben waarbij je ze gewoon zegt: ‘Ga je verbeteren.’ modelcapaciteitga de afstemming oplossen’, en dat zullen ze doen, niet dit jaar’, zei hij.

