Home Nieuws Het gerucht gaat dat OpenAI deze maand GPT-5.1 zal uitbrengen. Verwacht minder...

Het gerucht gaat dat OpenAI deze maand GPT-5.1 zal uitbrengen. Verwacht minder hallucinaties, beter, creatiever schrijven en meer ondeugende stukjes

12
0

Open AI Kijkers hebben de afgelopen week iets merkwaardigs opgemerkt.

Verwijzingen naar GPT-5.1 blijven behouden verschijnen in de codebase van OpenAIen een ‘verhuld’ model met de codenaam Polaris Alpha, waarvan algemeen wordt aangenomen dat het afkomstig is van OpenAI willekeurig verschenen in OpenRoutereen platform dat AI nerds gebruiken om nieuwe systemen te testen.

Er is nog niets officieel. Maar dit alles suggereert dat OpenAI zich stilletjes voorbereidt op het uitbrengen van een nieuwe versie van hun GPT-5-model. Bronnen uit de industrie wijzen op een mogelijke releasedatum al op 24 november.

Als GPT-5.1 werkelijkheid wordt, welke nieuwe mogelijkheden zal het model dan hebben?

Als voormalig OpenAI bètatester (en iemand die elke maand miljoenen GPT-5-tokens verbrandt) is dit wat ik verwacht.

Een groter contextvenster (maar nog steeds niet groot genoeg)

Een AI-model contextvenster is de hoeveelheid gegevens (gemeten in tokens, die in feite stukjes woord zijn) die het in één keer kan verwerken.

Zoals de naam al aangeeft, betekent een groter contextvenster dat een model meer context en externe informatie in overweging kan nemen bij het verwerken van een bepaald verzoek. Dit resulteert meestal in een betere output.

Ik sprak onlangs bijvoorbeeld een kunstenaar die Google’s Gemini een document van 300 pagina’s overhandigt elke keer dat hij ermee chat. Het document bevat fragmenten uit zijn persoonlijke dagboek, volledige kopieën van de scenario’s die hij heeft geschreven en nog veel meer.

Dankzij deze waanzinnig grote hoeveelheid context kan het model hem veel betere, meer op maat gemaakte antwoorden bieden dan wanneer hij er eenvoudigweg mee zou communiceren zoals de gemiddelde gebruiker.

Dit werkt grotendeels omdat Gemini een Contextvenster van 1 miljoen tokens. GPT-5’s zijn in vergelijking relatief nietig slechts 196.000 tokens in ChatGPT (uitgebreid naar 400.000 tokens bij gebruik door ontwikkelaars via de API van het bedrijf).

Dat kleinere contextvenster plaatst GPT-5 en ChatGPT in een groot nadeel. Als je het model bijvoorbeeld wilt gebruiken om een ​​boek te bewerken of een grote codebase te verbeteren, zul je snel zonder tokens komen te zitten.

Wanneer OpenAI GPT-5.1 uitbrengt, bronnen geven aan dat het zal worden geleverd met een contextvenster van 256.000 tokens bij gebruik via de ChatGPT-interface, en misschien het dubbele in de API.

Dat is zeker beter dan de GPT-5 van vandaag. Maar het blijft nog steeds ver achter bij Gemini, vooral als Google bereidt zich voor om zijn eigen upgrades uit te voeren.

OpenAI zou op het laatste moment een verrassende upgrade naar 1 miljoen tokens kunnen maken. Maar als het contextvenster van 256.000 tokens behouden blijft, kun je veel gemopper verwachten van de ontwikkelaarsgemeenschap over waarom het venster nog steeds niet groot genoeg is.

Nog minder hallucinaties

OpenAI’s GPT-5-model schiet in veel opzichten tekort. Maar één ding waar het heel goed in is, is het geven van nauwkeurige, grotendeels hallucinatievrije reacties.

Ik gebruik de modellen van OpenAI vaak om onderzoek te doen. Bij eerdere modellen, zoals GPT-4o, ontdekte ik dat ik alles wat het model produceerde zorgvuldig moest controleren op feiten om er zeker van te zijn dat het geen nieuw softwarehulpmiddel verbeeldde dat niet echt bestaat, of tegen mij loog over talloze andere kleine, cruciale dingen.

Met GPT-5 merk ik dat ik dat veel minder hoef te doen. Het model is niet perfect. Maar OpenAI heeft het probleem van wilde hallucinaties grotendeels opgelost.

Volgens de eigen gegevens van het bedrijfHallucineert GPT-5 slechts 26% van de tijd bij het oplossen van een complex benchmarkprobleem, tegenover 75% van de tijd bij oudere modellen. Bij normaal gebruik vertaalt dit zich in een veel lager hallucinatiepercentage bij eenvoudigere, alledaagse zoekopdrachten die niet zijn ontworpen om het model te laten struikelen.

Verwacht met GPT-5.1 dat OpenAI zijn nieuwe, hallucinatievrije richting zal verdubbelen. Het bijgewerkte model zal waarschijnlijk nog beter werk leveren bij het voorkomen van fouten.

Er zijn echter kosten verbonden. Modellen die minder hallucineren, hebben de neiging minder risico’s te nemen en kunnen dus minder creatief lijken dan ongedwongen, met hallucinaties beladen modellen.

OpenAI zal waarschijnlijk proberen zorgvuldig de link tussen nauwkeurigheid en creativiteit te leggen met GPT-5.1. Maar er is geen garantie dat ze zullen slagen.

Beter en creatiever schrijven

Op dezelfde manier merkten gebruikers, toen OpenAI hun GPT-5-model uitbracht, al snel dat het saai, levenloos proza ​​opleverde.

Destijds voorspelde ik dat OpenAI dat in wezen had gedaan gezien het model een ‘emotionele lobotomie’, het doden van zijn emotionele intelligentie om een ​​zorgwekkende trend te beteugelen waarbij het model gebruikers naar beneden stuurt psychotische spiralen.

Het bleek dat ik gelijk had. In een bericht op X vorige maandgaf Sam Altman toe: “We hebben ChatGPT behoorlijk restrictief gemaakt om ervoor te zorgen dat we voorzichtig waren met geestelijke gezondheidsproblemen.”

Maar Altman zei ook in de post: “nu we de ernstige geestelijke gezondheidsproblemen hebben kunnen verzachten en over nieuwe hulpmiddelen beschikken, zullen we in de meeste gevallen de beperkingen veilig kunnen versoepelen.”

Dat proces begon met de introductie van nieuwe, emotioneel intelligentere persoonlijkheden in het bestaande GPT-5-model. Maar het zal waarschijnlijk doorgaan en intensiveren met GPT-5.1.

Ik verwacht dat het nieuwe model de algehele intelligentie en nauwkeurigheid van GPT-5 zal hebben, maar met een persoonlijkheid die past bij de emotioneel diepe GPT-4o.

Dit zal waarschijnlijk gepaard gaan met veel robuustere waarborgen om ervoor te zorgen dat 5.1 gesprekken vermijdt die iemand die in een geestelijke gezondheidscrisis verkeert, zouden kunnen kwetsen.

Hopelijk kan het bedrijf met GPT-5.1 die kwetsbare gebruikers beschermen zonder de hersenen van de bot voor alle anderen te blokkeren.

Stoute stukjes

Als je preuts bent over NSFW-dingen, bedek dan misschien je oren voor dit deel.

In hetzelfde X-bericht liet Altman op subtiele wijze een zin vallen die het internet in rep en roer bracht: “Naarmate we leeftijdsbeperking vollediger uitrollen en als onderdeel van ons principe ‘behandel volwassen gebruikers als volwassenen’, zullen we nog meer toestaan, zoals erotica voor geverifieerde volwassenen.”

Het idee dat Amerika’s toonaangevende AI-bedrijf massa’s computergegenereerde erotica op de markt brengt, heeft al tot koortsachtig commentaar geleid uit uiteenlopende bronnen als politici, Christelijke leiders, technische verslaggeversen (te oordelen naar het aantal stemmen), een groot deel van Reddit.

Van hun kant lijkt OpenAI echter behoorlijk toegewijd om deze belofte waar te maken. In een analyse die zeker zinvol is in de vreemde techno-libertarische kringen van de AI-wereld, is de kwestie nauw verbonden met persoonlijke vrijheid en autonomie.

In een recent artikel over de toekomst van kunstmatige intelligentie herhaalde OpenAI opnieuw: “Wij geloven dat volwassenen AI op hun eigen voorwaarden moeten kunnen gebruiken, binnen brede grenzen die door de samenleving worden gedefinieerd”, waarbij volledige toegang tot AI “op één lijn komt met elektriciteit, schoon water of voedsel.”

Dat wil alleen maar zeggen dat met de release van GPT-5.1 (of misschien iets na de release, zodat de onvermijdelijke media-razernij de minder interessante aspecten van het nieuwe model niet overschaduwt), de vangrails rond de ondeugende stukjes van ChatGPT vrijwel zeker zullen verdwijnen.

Diepere gedachte

Naast het doden van de emotionele intelligentie van GPT-5, maakte OpenAI nog een misstap bij het uitbrengen van GPT-5.

Het bedrijf probeerde alle zoekopdrachten binnen één model te verenigen, waardoor ChatGPT zelf kon kiezen of het een eenvoudigere versie van GPT-5 met minder inspanning wilde gebruiken, of een langzamere, meer doordachte versie.

Het idee was nobel: er is weinig reden om een ​​ongelooflijk krachtige, langzame, hulpbronnenintensieve LLM te gebruiken om een ​​vraag te beantwoorden als: “Is tahini nog steeds goed na een maand in de koelkast?”

Maar in de praktijk de functie was een mislukking. ChatGPT was niet goed in het bepalen hoeveel moeite er nodig was om een ​​bepaalde vraag te beantwoorden, wat betekende dat mensen die complexe vragen stelden vaak naar een goedkoop, waardeloos model werden geleid dat vreselijke resultaten opleverde.

OpenAI heeft het probleem in ChatGPT opgelost met een gebruikersinterfacekludge. Maar met GPT-5.1 wijzen de eerste aanwijzingen erop dat OpenAI zijn model opnieuw opsplitst in Instant- en Thinking-versies.

De eerste zal waarschijnlijk veel sneller reageren op eenvoudige vragen dan GPT-5, terwijl de laatste langer zal duren, meer tokens zal verwerken en betere resultaten zal opleveren bij complexe taken.

Cruciaal is dat het erop lijkt dat de gebruiker opnieuw expliciet tussen de twee modellen kan kiezen. Dat zou snellere resultaten moeten opleveren als een vraag echt eenvoudig is, en een beter vermogen om ingewikkelde problemen op te lossen.

OpenAI heeft liet doorschemeren dat zijn toekomstige modellen volgend jaar “zeer kleine ontdekkingen zullen kunnen doen” op gebieden als wetenschap en geneeskunde, terwijl “systemen die belangrijkere ontdekkingen kunnen doen” al in 2028 zullen verschijnen. GPT-5.1 zal waarschijnlijk een eerste stap op dat pad zijn.

Een poging om de koers te corrigeren

Totdat OpenAI GPT-5.1 formeel vrijgeeft in een van zijn kenmerkende, wankele livestreams, blijft dit allemaal speculatief. Maar gezien mijn geschiedenis met OpenAI (die teruggaat tot de hoogtijdagen van GPT-3) zijn dit enkele veranderingen die ik verwacht als het 5.1-model live gaat.

Over het geheel genomen lijkt GPT-5.1 een poging om veel van de flagrante problemen met GPT-5 te corrigeren, terwijl het ook een verdubbeling is van de meer vrijheidsgerichte, op nauwkeurigheid gerichte benadering van OpenAI.

Het nieuwe model zal waarschijnlijk beter kunnen denken, (ahem) ‘flirten’, schrijven en communiceren dan zijn voorgangers.

Of het deze dingen beter zal doen dan een groeiende stal van concurrerende modellen van Google, Anthropic en talloze Chinese AI-laboratoriaMaar dat is voor iedereen een raadsel.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in