Home Nieuws Google Gemini 3.1 Pro eerste indrukken: een ‘Deep Think Mini’ met aanpasbare...

Google Gemini 3.1 Pro eerste indrukken: een ‘Deep Think Mini’ met aanpasbare redenering op aanvraag

1
0
Google Gemini 3.1 Pro eerste indrukken: een ‘Deep Think Mini’ met aanpasbare redenering op aanvraag

De afgelopen drie maanden heeft Googles Gemini 3 Pro stand gehouden als een van de meest capabele grensmodellen die er zijn. Maar in de snel veranderende wereld van AI is drie maanden een leven lang – en de concurrenten hebben niet stilgezeten.

Dat heeft Google eerder vandaag bekendgemaakt Tweeling 3.1 Proeen update die een belangrijke innovatie brengt in het werkpaard-machtsmodel van het bedrijf: drie niveaus van aanpasbaar denken die er effectief een lichtgewicht versie van Google’s gespecialiseerde Deep Think-redeneersysteem van maken.

De release markeert de eerste keer dat Google een ‘punt één’-update voor een Gemini-model heeft uitgebracht, wat een verschuiving in de releasestrategie van het bedrijf aangeeft van periodieke lanceringen van de volledige versie naar frequentere incrementele upgrades. Belangrijker voor AI-teams van ondernemingen die hun modellenstapel evalueren, is dat het nieuwe drieledige denksysteem van 3.1 Pro – laag, gemiddeld en hoog – ontwikkelaars en IT-leiders één enkel model biedt waarmee hun redeneringsinspanningen dynamisch kunnen worden geschaald, van snelle antwoorden op routinevragen tot diepgaande redeneersessies van meerdere minuten voor complexe problemen.

Het model wordt nu als preview uitgerold in de Gemini API via Google AI StudioGemini CLI, Google’s agentische ontwikkelingsplatform Antigravity, Vertex AI, Gemini Enterprise, Android Studio, de Gemini-app voor consumenten en NotebookLM.

Het ‘Deep Think Mini’-effect: aanpasbaar redeneren op aanvraag

Het meest consequente kenmerk van Gemini 3.1 Pro is niet één enkel benchmarkgetal; het is de introductie van een drieledig denkniveausysteem dat gebruikers nauwkeurige controle geeft over hoeveel rekeninspanning het model in elke reactie investeert.

Gemini 3 Pro bood slechts twee denkmodi: laag en hoog. De nieuwe 3.1 Pro voegt een medium instelling toe (vergelijkbaar met de vorige high) en herziet, kritisch genoeg, wat “high” betekent. Als 3.1 Pro op de hoogste stand staat, gedraagt ​​het zich als een “miniversie van Gemini Deep Think” – het gespecialiseerde redeneermodel van het bedrijf dat vorige week bijgewerkt.

De gevolgen voor de implementatie in ondernemingen kunnen aanzienlijk zijn. In plaats van verzoeken door te sturen naar verschillende gespecialiseerde modellen op basis van taakcomplexiteit – een gebruikelijk maar operationeel belastend patroon – kunnen organisaties nu één enkel modeleindpunt gebruiken en de redeneerdiepte aanpassen op basis van de taak die voorhanden is. Het routinematig samenvatten van documenten kan worden uitgevoerd op laag denkvermogen met snelle reactietijden, terwijl complexe analytische taken kunnen worden verheven tot hoog denkvermogen voor redeneren op het niveau van Deep Think.

Benchmarkprestaties: meer dan een verdubbeling van de redenering ten opzichte van 3 Pro

De door Google gepubliceerde benchmarks vertellen een verhaal van dramatische verbeteringen, vooral op gebieden die te maken hebben met redeneren en handelen.

Google Gemini 3.1 Pro benchmarkgrafiek. Krediet: Google

Op ARC-AGI-2een benchmark die het vermogen van een model evalueert om nieuwe abstracte redeneerpatronen op te lossen, scoorde 3,1 Pro 77,1% – meer dan het dubbele van de 31,1% behaald door Gemini 3 Pro en aanzienlijk hoger dan Anthropic’s Sonnet 4.6 (58,3%) en Opus 4.6 (68,8%). Dit resultaat overtreft ook de GPT-5.2 van OpenAI (52,9%).

De winsten strekken zich over de hele linie uit. Op Het laatste examen van de mensheideen rigoureuze benchmark voor academisch redeneren, behaalde 3.1 Pro 44,4% zonder tools, vergeleken met 37,5% voor 3 Pro en vóór zowel Claude Sonnet 4.6 (33,2%) als Opus 4.6 (40,0%). Op GPQA-diamanteen wetenschappelijke kennisevaluatie, bereikte 3.1 Pro 94,3% en presteerde daarmee beter dan alle beursgenoteerde concurrenten.

Waar de resultaten vooral relevant worden voor zakelijke AI-teams zijn de agentische benchmarks – de evaluaties die meten hoe goed modellen presteren wanneer ze tools en uit meerdere stappen bestaande taken krijgen, het soort werk dat in toenemende mate de productie-AI-implementaties definieert.

Op Terminal-Bench 2.0dat agentische terminalcodering evalueert, scoorde 3.1 Pro 68,5% vergeleken met 56,9% voor zijn voorganger. Op MCP-atlaseen benchmark die meerstapsworkflows meet met behulp van het Model Context Protocol, bereikte 3.1 Pro 69,2% – een verbetering van 15 punten ten opzichte van de 54,1% van 3 Pro en bijna 10 punten voorsprong op zowel Claude als GPT-5.2. En verder BladerenCompwaarmee de zoekmogelijkheden op internet worden getest, behaalde 3.1 Pro 85,9% en steeg daarmee voorbij de 59,2% van 3 Pro.

Waarom Google voor een ‘0.1’-release heeft gekozen – en wat deze aangeeft

Het versiebesluit is op zichzelf al opmerkelijk. Eerdere Gemini-releases volgden een patroon van gedateerde previews – meerdere 2.5-previews bijvoorbeeld, voordat ze algemeen verkrijgbaar waren. De keuze om deze update aan te duiden als 3.1 in plaats van een andere 3 Pro-preview suggereert dat Google de verbeteringen als substantieel genoeg beschouwt om een ​​versieverhoging te rechtvaardigen, terwijl de “punt één”-framing de verwachting schept dat dit een evolutie is, en geen revolutie.

In de blogpost van Google staat dat 3.1 Pro rechtstreeks voortbouwt op lessen uit de Gemini Deep Think-serie, waarbij technieken uit zowel eerdere als recentere versies zijn verwerkt. De benchmarks suggereren sterk dat versterkend leren een centrale rol heeft gespeeld in de winst, vooral bij taken als ARC-AGI-2, coderingsbenchmarks en agentische evaluaties – precies de domeinen waar op RL gebaseerde trainingsomgevingen duidelijke beloningssignalen kunnen opleveren.

Het model wordt uitgebracht als preview in plaats van als een lancering voor algemene beschikbaarheid, waarbij Google beweert dat het vooruitgang zal blijven boeken op gebieden zoals agentische workflows voordat het overgaat naar volledige GA.

Concurrentie-implicaties voor uw zakelijke AI-stack

Voor IT-beslissers die aanbieders van frontier-modellen beoordelen, moet de release van Gemini 3.1 Pro hen niet alleen doen heroverwegen welke modellen ze moeten kiezen, maar ook hoe ze zich kunnen aanpassen aan zo’n snel tempo van veranderingen voor hun eigen producten en diensten.

De vraag is nu of deze release een reactie van concurrenten oproept. De oorspronkelijke lancering van Gemini 3 Pro afgelopen november veroorzaakte een golf van modelreleases in zowel eigen als open-weight ecosystemen.

Nu 3.1 Pro het leiderschap in de benchmark in verschillende kritieke categorieën terugwint, wordt de druk uitgeoefend op Anthropic, OpenAI en de open-weight-gemeenschap om te reageren – en in het huidige AI-landschap wordt die reactie waarschijnlijk gemeten in weken, niet in maanden.

Beschikbaarheid

Gemini 3.1 Pro is nu beschikbaar als preview via de Gemini-API in Google AI Studio, Gemini CLI, Google Antigravity en Android Studio voor ontwikkelaars. Enterprise-klanten hebben er toegang toe via Hoekpunt AI En Gemini onderneming. Consumenten met een Google AI Pro- en Ultra-abonnement hebben er toegang toe via de Gemini-app en NotebookLM.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in