Home Nieuws Het afgeslankte Gemini-model van Google wint stilletjes AI-klanten

Het afgeslankte Gemini-model van Google wint stilletjes AI-klanten

5
0
Het afgeslankte Gemini-model van Google wint stilletjes AI-klanten

Bij Antropisch’s ontwikkelaarsconferentie vorige week kwam ik tegen Guillermo RauchCEO van AI-startup Vercel. We begonnen te praten, en het eerste bedrijf dat hij noemde was niet Anthropic; het was Google.

Over het geheel genomen is de vraag naar AI buiten de hitlijsten, zei hij. Maar GooglenVooral de modellen van ’s zijn erg in trek bij Vercel klanten. Rauch zei zelfs dat hij onlangs een topmanager van Google moest bellen om om meer Gemini te vragen tokensde kerneenheid van AI-gebruik.

Terwijl al het gepraat de laatste tijd ging over Anthropic en OpenAI, die van Google Tweeling heeft stilletjes terrein gewonnen, zei hij.

Dat zie je aan de AI Gateway van Vercel, waarmee bedrijven hun apps via één systeem aan verschillende AI-modellen kunnen koppelen. Het wordt voornamelijk gebruikt door AI-startups, softwarebedrijven en zakelijke productteams die AI-functies uitvoeren, zoals chatbots, codeerassistenten, zoekhulpmiddelen en copiloten.

Bekijk dit diagram. In maart waren Anthropic-modellen leidend, gebaseerd op het aantal tokens (verkeer) dat door Vercels AI Gateway werd afgehandeld. Begin april sprong het Gemini 3 Flash-model van Google aan de leiding en bleef daar. En dit is zelfs vóór de grote jaarlijkse conferentie van Google, I/O, die volgende week van start gaat. Het bedrijf zal waarschijnlijk een groot aantal capabele AI-modellen, -tools en -functies onthullen. (Ik zal er zijn, dus stem af volgende week).


Gegevens van Vercel's AI Gateway

Gegevens van Vercel’s AI Gateway

Vercel



Gemini Flash is minder krachtig dan het volledige Gemini 3-model, maar is sneller en goedkoper in gebruik. Dat maakt het populair, vooral onder zakelijke klanten van Vercel.

“Bedrijfsteams kiezen vaak voor Gemini Flash en Claude Haiku, de kleinste, snelste en goedkoopste modellen die elk laboratorium verzendt”, vertelde Rauch me. “Vooral Flash kent een sterke acceptatie van B2C omdat het niet veel hallucineert, tools effectief gebruikt en het snel en betaalbaar is.”

Bij AI zijn de antwoorden echter nooit eenvoudig. Er zijn andere manieren om succes te meten, zoals hoeveel gebruikers aan modellen uitgeven

“Mij wordt vaak gevraagd welk laboratorium ‘winnend’ is, maar wat we in de productie zien lijkt in niets op de benchmark-klassementen,” zei Rauch. “AI Gateway weerspiegelt een verscheidenheid aan modellen die verschillende gebruiksscenario’s winnen.”

Door het gebruik van tokens heeft Google in april duidelijk gewonnen. Maar op basis van de uitgegeven dollars leidde Anthropic met een aandeel van 61%. “Sommige modellen winnen met goedkoop, groot verkeer. Anderen winnen met duur, kwaliteitskritisch werk. Ze lossen verschillende problemen op”, legt Rauch uit.

Het uitgavenaandeel van OpenAI verdrievoudigde van maart tot april (van 4% naar 12%) als gevolg van de lancering van de nieuwe GPT-5.4 en 5.5 AI-modelseries. Google klom van 8% naar 21%, gebaseerd op de uitgegeven dollars, naarmate het gebruik van Gemini Flash groeide.

“Een momentopname van een bepaalde maand voorspelt niet de volgende”, waarschuwde Rauch.

Dat geldt vooral nu Google I/O om de hoek ligt.

Meld u aan voor de Tech Memo-nieuwsbrief van BI hier. Neem contact met mij op via e-mail op abarr@businessinsider.com.

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in