Nvidia zal uitgeven 26 miljard dollar in de komende vijf jaar om open source te bouwen kunstmatige intelligentie modellen, volgens a Financiële aangifte 2025. Leidinggevenden bevestigden het nieuws, dat nog niet eerder is gerapporteerd, in interviews met WIRED.
De aanzienlijke investering zou kunnen zien Nvidia evolueren van een chipmaker met een indrukwekkende softwarestack naar een bonafide grens laboratorium waarmee kan concurreren Open AI En Diepzoeken. Het is een strategische zet die de positie van Nvidia als ’s werelds toonaangevende chipfabrikant op het gebied van AI verder zou kunnen verstevigen, aangezien de modellen zijn afgestemd op de hardware van het bedrijf.
Open source-modellen zijn modellen waarbij de gewichten of de parameters die het gedrag van een model bepalen publiekelijk worden vrijgegeven, soms met de details van de architectuur en training ervan. Hierdoor kan iedereen het downloaden en uitvoeren op zijn eigen computer of in de cloud. In het geval van Nvidia onthult het bedrijf ook de technische innovaties die betrokken zijn bij het bouwen en trainen van zijn modellen, waardoor het voor startups en onderzoekers gemakkelijker wordt om de innovaties van het bedrijf aan te passen en erop voort te bouwen.
Woensdag bracht Nvidia ook Nemotron 3 Super uit, het meest capabele AI-model met open gewicht tot nu toe. Het nieuwe model heeft 128 miljard parameters (een maatstaf voor de omvang en complexiteit van het model), waardoor het ongeveer gelijk is aan de grootste versie van OpenAI’s GPT-OSS, hoewel het bedrijf beweert dat het beter presteert dan GPT-OSS en andere modellen in verschillende benchmarks.
Concreet beweert Nvidia dat Nemotron 3 Super een score van 37 heeft gekregen op de Artificial Intelligence Index, die modellen scoort in 10 verschillende benchmarks. GPT-OSS scoorde 33, maar verschillende Chinese modellen scoorden hoger. Nvidia zegt dat Nemotron 3 Super in het geheim is getest op PinchBench, een nieuwe benchmark die het vermogen van een model beoordeelt om OpenClaw te besturen, en op nummer één staat in die test.
Nvidia introduceerde ook een aantal technische trucjes waarmee het Nemotron 3 trainde. Deze omvatten architectuur- en trainingstechnieken die het redeneervermogen van het model, de verwerking van lange contexten en het reactievermogen op versterkend leren verbeteren.
“Nvidia neemt de ontwikkeling van open modellen veel serieuzer”, zegt Bryan Catanzaro, VP van toegepast deep learning-onderzoek bij Nvidia. “En we boeken veel vooruitgang.”
Open grens
Meta was het eerste grote AI-bedrijf dat dit deed een open model uitbrengenLlama, in 2023. CEO Mark Zuckerberg heeft onlangs echter de AI-inspanningen van het bedrijf opnieuw opgestart en gaf dat aan het maakt toekomstige modellen misschien niet volledig open. OpenAI biedt een model met open gewicht, genaamd GPT-ossmaar het is inferieur aan het beste eigen aanbod van het bedrijf en is niet erg geschikt voor aanpassing.
De beste Amerikaanse modellen, van OpenAI, AntropischEn Googlenis alleen toegankelijk via de cloud of via een chatinterface. Daarentegen worden de gewichten voor veel Chinese topmodellen, van DeepSeek, Alibaba, Moonshot AI, Z.ai en MiniMax, openlijk en gratis vrijgegeven. Als gevolg hiervan bouwen veel startups en onderzoekers over de hele wereld momenteel voort op Chinese modellen.
“Het is in ons belang om het ecosysteem te helpen ontwikkelen”, zegt Catanzaro, die in 2011 bij Nvidia kwam werken en de verschuiving van het bedrijf van het maken van grafische kaarten voor gaming naar het maken van silicium voor AI heeft helpen leiden. Nvidia bracht het eerste Nemotron-model uit in november 2023. Hij voegt eraan toe dat Nvidia onlangs de voortraining van een model met 550 miljard parameters heeft afgerond. (Voortraining omvat het invoeren van enorme hoeveelheden gegevens in een model, verspreid over grote aantallen gespecialiseerde chips die parallel draaien.) Nvidia heeft sindsdien een reeks modellen uitgebracht die gespecialiseerd zijn voor gebruik op gebieden als robotica, klimaatmodellering en het vouwen van eiwitten.
Kari Briski, VP van generatieve AI-software voor ondernemingen, zegt dat de toekomstige AI-modellen van Nvidia het bedrijf zullen helpen niet alleen zijn chips te verbeteren, maar ook de datacenters op supercomputerschaal die het bouwt. “We bouwen het om onze systemen uit te breiden en niet alleen de rekenkracht te testen, maar ook de opslag en netwerken, en om onze roadmap voor hardware-architectuur uit te bouwen”, zegt ze.


