Nvidia heeft gemaakt een fortuin dat chips levert aan bedrijven die eraan werken kunstmatige intelligentiemaar vandaag heeft de chipmaker een stap gezet om zelf een serieuzere modelmaker te worden door een reeks geavanceerde open modellen uit te brengen, samen met gegevens en hulpmiddelen om ingenieurs te helpen deze te gebruiken.
Deze stap, die komt op een moment dat AI-bedrijven als OpenAI, Google en Anthropic hun eigen steeds capabelere chips ontwikkelen, zou een bescherming kunnen vormen tegen het feit dat deze bedrijven in de loop van de tijd af zullen wijken van de technologie van Nvidia.
Open modellen vormen al een cruciaal onderdeel van het AI-ecosysteem en veel onderzoekers en startups gebruiken ze om te experimenteren, prototypen te maken en te bouwen. Hoewel OpenAI en Google kleine open modellen aanbieden, updaten ze deze niet zo vaak als hun rivalen in China. Om deze en andere redenen zijn open modellen van Chinese bedrijven momenteel veel populairder gegevens van Knuffelgezichteen hostingplatform voor open source-projecten.
De nieuwe Nemotron 3-modellen van Nvidia behoren tot de beste die kunnen worden gedownload, aangepast en op de eigen hardware kunnen worden uitgevoerd, volgens benchmarkscores die het bedrijf vóór de release heeft gedeeld.
“Open innovatie is de basis van de vooruitgang op het gebied van AI”, zei CEO Jensen Huang voorafgaand aan het nieuws in een verklaring. “Met Nemotron transformeren we geavanceerde AI in een open platform dat ontwikkelaars de transparantie en efficiëntie geeft die ze nodig hebben om agentische systemen op schaal te bouwen.”
Nvidia hanteert een volledig transparantere aanpak dan veel van zijn Amerikaanse rivalen door de gegevens vrij te geven die worden gebruikt om Nemotron te trainen – een feit dat ingenieurs zou moeten helpen de modellen gemakkelijker aan te passen. Het bedrijf brengt ook tools uit om te helpen bij maatwerk en verfijning. Dit omvat een nieuwe hybride latente mix van experts-modelarchitectuur, die volgens Nvidia vooral goed is voor het bouwen van AI-agents die acties kunnen ondernemen op computers of op internet. Het bedrijf lanceert ook bibliotheken waarmee gebruikers agenten kunnen trainen om dingen te doen met behulp van versterkend lerenwaarbij modellen gesimuleerde beloningen en straffen krijgen.
Nemotron 3-modellen zijn er in drie maten: Nano, met 30 miljard parameters; Super, dat 100 miljard heeft; en Ultra, die 500 miljard heeft. De parameters van een model komen grofweg overeen met hoe capabel het is en hoe onhandig het is om te draaien. De grootste modellen zijn zo omslachtig dat ze op rekken met dure hardware moeten draaien.
Modelfunderingen
Kari Ann Briski, vice-president van generatieve AI-software voor ondernemingen bij Nvidia, zei dat open modellen om drie redenen belangrijk zijn voor AI-bouwers: bouwers moeten steeds vaker modellen aanpassen voor bepaalde taken; het helpt vaak om vragen door te geven aan verschillende modellen; en het is gemakkelijker om na training intelligentere reacties uit deze modellen te halen door ze een soort gesimuleerde redenering te laten uitvoeren. “Wij geloven dat open source de basis vormt voor AI-innovatie, waardoor de wereldeconomie blijft versnellen”, aldus Briski.
De socialemediagigant Meta bracht onder de naam de eerste geavanceerde open modellen uit Lama in februari 2023. Nu de concurrentie is toegenomen, heeft Meta echter aangegeven dat de toekomstige releases mogelijk niet open source zijn.
De stap maakt deel uit van een grotere trend in de AI-industrie. Het afgelopen jaar hebben Amerikaanse bedrijven afstand genomen van de openheid, zijn ze geheimzinniger geworden over hun onderzoek en zijn ze terughoudender geworden om hun rivalen op de hoogte te stellen van hun nieuwste technische trucs.



