Home Nieuws De AI-strategie van Google komt eindelijk in beeld

De AI-strategie van Google komt eindelijk in beeld

5
0
De AI-strategie van Google komt eindelijk in beeld

In een groot salvo in de AI race kondigde Google dinsdag een hele reeks nieuwe en bijgewerkte producten aan op zijn I/O-ontwikkelaarsconferentie. Deze varieerden van tools die persoonlijke AI-agenten inzetten tot codegeneratoren, zoektools en een nieuw ‘wereldmodel’ voor het genereren van fysiek nauwkeurige video’s.

Alles bij elkaar schetsen de releases een beeld van de huidige strategie van Google om kunstmatige intelligentie naar consumenten en bedrijven te brengen. Het is een strategie die effectief gebruik maakt van de enorme informatie-infrastructuur van het bedrijf, opgebouwd door middel van zoeken, op een manier die het duidelijke voordelen geeft ten opzichte van nieuwere AI-bedrijven.

Nieuwe modellen

Google Deepmind’s nieuwste modellen zijn groter en slimmer, diep multimodaal en afgestemd op actie. Veel van de nieuwe producten en functies die op I/O zijn aangekondigd, worden mogelijk gemaakt door het nieuwe Gemini 3.5 Flash-model. Google zegt dat het model is geoptimaliseerd voor snelheid en efficiëntie, vier keer sneller is dan andere grensmodellen en tussen de helft en een derde van de prijs van vergelijkbare modellen kost. Gemini 3.1 Pro was voorheen het beste model van DeepMind, en 3.5 Flash presteert beter dan het op bijna alle benchmarks, met name op het gebied van coderen en gereedschapgebruik.

Er is ook een Gemini 3.5 Pro-model, dat het nieuwe vlaggenschipmodel van DeepMind zal worden, maar onderzoekers bestuderen nog steeds de gevolgen voor de veiligheid en zijn van plan het ergens in juni publiekelijk vrij te geven. “Al onze focus bij de 3.5-serie lag op het nemen van de modelintelligentie en ervoor zorgen dat het gebruik van tools, het volgen van instructies, gebruiksscenario’s met een lange horizon en het decoderen van agenten allemaal goed werken”, zei Alphabet-CEO Sundar Pichai tijdens een gesprek met verslaggevers maandag.

Google heeft ook aangekondigd deel te nemen aan de groeiende race om ‘wereldmodellen’ te bouwen, oftewel modellen die digitale omgevingen of video kunnen creëren die trouw blijven aan de fysieke eigenschappen van de echte wereld. Gemini Omni, zoals het wordt genoemd, is multimodaal, wat betekent dat het kan verschillende soorten output genereren (video, afbeeldingen, tekst, audio en meer) op basis van aanwijzingen die inhoud in dezelfde formaten bevatten.

Een voorbeeld: een gebruiker kan een afbeelding van zichzelf aanleveren, samen met een video, en het model zal een redenering op hoog niveau gebruiken om haar gelijkenis als personage in de video te laten verschijnen. Google lanceert vandaag een kleine versie van Omni, genaamd Omni Flash. Een groter Omni Pro-model is momenteel in ontwikkeling.

De voordelen ervan verruimen

Voordat Google iets zei over zijn nieuwe modellen, sprak het over de infrastructuur die het heeft gebouwd om deze te ondersteunen. Google zegt dat het dit jaar tot 190 miljard dollar aan nieuwe infrastructuur verwacht te besteden. Een groot deel daarvan zal naar nieuwe datacenters gaan Tweeling modellen draaien op honderdduizenden eigen AI-chips van Google.

Het bedrijf is nu bezig met de achtste generatie tensor processing units (TPU’s), de chips die de miljarden wiskundige berekeningen uitvoeren die neurale netwerken nodig hebben. Naarmate AI-laboratoria hun computerbronnen opschalen, hebben de kracht en de kostenefficiëntie van de chips die ze gebruiken steeds meer invloed op de economische aspecten van het aanbieden van AI-modellen en apps aan gebruikers. Google zegt dat het trainen van grote AI-modellen niet langer beperkt is tot één enkel datacenter, maar in plaats daarvan kan worden gedistribueerd over meer dan 1 miljoen TPU’s wereldwijd, waardoor ’s werelds grootste trainingscluster ontstaat.

Google heeft mogelijk ook een duidelijk voordeel als het gaat om trainingsgegevens. Het bedrijf beschikt zeer waarschijnlijk over de meest geavanceerde webcrawler ter wereld, de technologie die voortdurend webpagina’s doorzoekt en indexeert, zodat deze kunnen worden doorzocht. Onderzoekers trainen grote AI-modellen op enorme hoeveelheden van deze webinhoud, en het volume, de kwaliteit en de samenstelling van die trainingsgegevens kunnen een directe invloed hebben op de algehele intelligentie van een model.

De crawlers van Google kunnen eenvoudigweg meer webpagina’s en inhoud bereiken dan die van andere AI-labs. Het bedrijf legt een groot deel van deze inhoud ook vast in een ‘kennisgrafiek’, waardoor het snel informatie kan verstrekken over mensen, plaatsen, organisaties, producten, evenementen en concepten. Al deze informatie kan worden gebruikt om modellen te trainen. Daarnaast heeft Google het volledige corpus aan YouTube-video’s beschikbaar voor AI-training. Die inhoud werd zeer waarschijnlijk gebruikt om het nieuwe Omni-wereldmodel te trainen om de relaties en beweging van objecten in de echte wereld te begrijpen.

Een groter punt: AI-laboratoria vragen het publiek om veel op geloof te vertrouwen. Vertrouwen dat onze informatie veilig zal worden bewaard. Het geloof dat bedrijven op verantwoorde wijze geld zullen uitgeven aan AI-veiligheid. Het geloof dat ze niet zullen toestaan ​​dat hun technologie wordt gebruikt voor schadelijke doeleinden, zoals autonome wapens of massasurveillance. Het geloof dat nieuwe datacenters de energieprijzen niet zullen doen stijgen en het milieu niet verder zullen belasten. Het geloof dat de voordelen van AI breed verspreid zullen worden. En het vertrouwen dat het bedrijf zelf uiteindelijk voldoende marktvraag en inkomsten zal genereren om te overleven. Google is niet perfect, maar de pragmatische benadering van AI van het bedrijf wekt de indruk dat het dergelijke beloftes op geloofwaardige wijze kan doen, en dat er feitelijk ook volwassenen in de zaal zitten.

Consumentenfocus

Het dominante verhaal is dat bedrijven als Google, Anthropic en OpenAI deze datacenters nodig hebben om met AI doordrenkte bedrijfsprocessen bij grote ondernemingen aan te sturen. Daarom was het opvallend om te horen dat Google zich bij I/O vooral richtte op nieuwe, op de consument gerichte modellen, apps en diensten. Pichai zei maandag tijdens de briefing dat Google probeert zoveel mogelijk grensinformatie naar de consument te brengen.

“Als iemand die is opgegroeid met Google-zoekopdrachtIk denk dat het hele ethos van Google is geweest om de informatie over de hele wereld te organiseren en universeel toegankelijk en bruikbaar te maken”, zegt Tulsee Doshi van DeepMind, senior director en productleider van generatieve AI- en Gemini-modellen, in een interview met Snel bedrijf. “En nu, in het tijdperk van agenten, kun je toevoegen: ‘Help gebruikers actie te ondernemen op basis van die informatie op een manier die doordacht en opzettelijk is.'”

Doshi erkende dat een groot deel van het rendement op de enorme investeringen van Google in datacenters waarschijnlijk afkomstig zal zijn van het bedrijfsleven.

Persoonlijke agenten

Dit jaar hebben Anthropic en OpenAI hun Claude Code- en Codex-coderingstools uitgebreid naar niet-coderend informatiewerk, inclusief het creëren en beheren van autonome agenten. Google is misschien wat laat op die partij, maar doet er alles aan om de achterstand in te halen.

Het bedrijf lanceerde Gemini Spark, een persoonlijke AI-agent die draait op Gemini 3.5 Flash en actief blijft op de achtergrond, zelfs als de apparaten van een gebruiker zijn uitgeschakeld.

De superkracht van Spark is wellicht snelle personalisatie. Door verbinding te maken met Gmail, Documenten, Presentaties en andere veelgebruikte Workspace-tools kan het snel de interesses, voorkeuren en werkgewoonten van een gebruiker leren kennen. Google zegt complexe taken aan te kunnen, zoals het opstellen van statusupdates uit meerdere documenten of het plannen van blokpartijen. Het kan ook taken in meerdere stappen uitvoeren, zoals het parseren van creditcardafschriften, het controleren van een Gmail-inbox op tijdgevoelige informatie of het omzetten van vergadernotities in gepolijste documenten

Zoals zijn rivalen al zijn begonnen, heeft Google ook connectoren gebouwd voor tools van derden, zoals KanvaOpenTabel, en Instacart. Google zegt dat er deze zomer meer mogelijkheden komen, waaronder de mogelijkheid om Spark rechtstreeks te sms’en of e-mailen, aangepaste subagenten te maken en Spark een lokale browser te laten besturen. Gebruikers bepalen tot welke apps Spark toegang heeft, en de agent is ontworpen om om bevestiging te vragen voordat belangrijke acties worden ondernomen, zoals het verzenden van e-mails of het uitgeven van geld. Google zegt dat Spark binnenkort naar zijn mobiele Gemini-app zal komen, waardoor gebruikers overal vandaan agenten kunnen beheren.

Zoeken en AI worden één

Aan het begin van de generatieve AI-hausse geloofden velen dat AI-zoekopdrachten de zoekadvertentieactiviteiten van Google, de melkkoe, zouden ruïneren. Google had altijd advertenties geplaatst naast gerangschikte zoekresultaten, de klassieke ‘tien blauwe links’, maar het was onduidelijk hoe adverteren zou werken rond op maat gemaakte, door AI gegenereerde antwoorden. Het bedrijf lijkt nu graag te willen beweren dat het radicaal verbeteren van de zoekfunctie met AI gebruikers eenvoudigweg aanmoedigde om vaker te zoeken, waardoor nieuwe advertentiemogelijkheden ontstonden die anders niet zouden hebben bestaan.

Google zei dat gebruikers in het eerste kwartaal van het jaar meer zoekopdrachten hebben uitgevoerd dan in welk kwartaal dan ook, waarschijnlijk vanwege het conversatiekarakter van AI-zoekopdrachten met meerdere zoekopdrachten. Er staat dat de zoekopdrachten in de “AI-modus” elk kwartaal zijn verdubbeld en dat meer dan een miljard mensen de tool nu elke maand gebruiken.

Google begon voor het eerst grote taalmodellen te gebruiken om de bedoeling achter zoekopdrachten van gebruikers te helpen interpreteren. Na de komst van ChatGPT introduceerde het voor sommige zoekopdrachten “AI-overzichten”, waarbij de resultaten werden verpakt in door AI gegenereerde samenvattingen die waren ontworpen om vragen van gebruikers te beantwoorden. Toen kwam ‘AI Mode’, een vooruitgang op hetzelfde idee. Nu kan AI het best worden begrepen als een permanente laag bovenop alle Google-zoekfunctionaliteit.

Velen gingen ervan uit dat Google een geheel nieuw soort advertentiebedrijf voor AI-zoekopdrachten zou moeten uitvinden. In plaats daarvan heeft het AI in zijn geheel geïntegreerd bestaande zoekadvertentiemachine. Google toont nog steeds traditionele zoekadvertenties boven en onder door AI gegenereerde reacties, en de bestaande advertentieveilingen blijven functioneren.

De nieuwe “Ask YouTube”-functie van Google, die binnenkort beschikbaar komt, biedt een nuttig microvoorbeeld van hoe AI het zoeken vergroot. Gebruikers kunnen al zoeken naar video’s over een onderwerp, bijvoorbeeld een how-to-vraag, en vervolgens door de video’s bladeren op zoek naar antwoorden. Binnenkort zal AI gebruikers met video’s laten ‘praten’ en vragen stellen over de inhoud ervan. YouTube kan ook aangepaste zoekresultaten retourneren die verschillende video’s combineren met instructies of stappen voor het voltooien van een taak. Op webbreed niveau wil Google dat zijn AI op dezelfde manier de informatie van de wereld analyseert, erover redeneert en vragen daarover beantwoordt.

“We hebben met succes het beste van de zoekmachine gecombineerd met het beste van AI, zodat we een echte AI-zoekervaring kunnen opbouwen die onze meest geavanceerde Gemini-modellen, onze nieuwste agentmogelijkheden en de volledige breedte van de informatie ter wereld samenbrengt”, zei Google Search-chef Liz Reid tijdens de persconferentie.

Belangrijk is dat de nieuwe zoekmogelijkheden die Google heeft aangekondigd, mogelijk worden gemaakt door het nieuwe Gemini 3.5 Flash-model.

Voor het eerst heeft Google zijn verouderde zoekvak aangepast, zodat het dynamisch wordt uitgebreid om langere en gedetailleerdere zoekopdrachten mogelijk te maken. In de komende maanden zullen gebruikers ook ‘achtergrondagenten’ kunnen inzetten die voortdurend specifieke informatie op internet monitoren of zelfs gepersonaliseerde, persistente tools zoals fitnesstrackers kunnen bouwen.

Het is de moeite waard om te onthouden dat de AI-ambities van Google nog steeds afhankelijk zijn van de gezondheid van zijn kernactiviteiten op het gebied van zoekadvertenties. In tegenstelling tot sommige van zijn collega’s vertrouwt Google niet uitsluitend op de inkomsten uit AI-model-API’s of abonnementen om de lichten aan te houden. AI is additief zoeken. Het is ook een krachtig nieuw product dat kan worden verkocht via de bloeiende cloudactiviteiten van het bedrijf. Wall Street heeft misschien zijn eigen manier om naar deze ontwikkelingen te kijken, maar de gediversifieerde activiteiten van Google moeten het bedrijf beschermen tegen de groeiende angst dat de huidige AI-boom – en de enorme kapitaaluitgaven die daarmee gepaard gaan – uiteindelijk een zeepbel kunnen blijken te zijn.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in