Home Nieuws Ai2 brengt Olmo 3 open modellen uit, die meta, DeepSeek en anderen...

Ai2 brengt Olmo 3 open modellen uit, die meta, DeepSeek en anderen rivaliseren op het gebied van prestaties en efficiëntie

2
0
Ai2 brengt Olmo 3 open modellen uit, die meta, DeepSeek en anderen rivaliseren op het gebied van prestaties en efficiëntie

GeekWire-foto / Todd Bishop

Het Allen Instituut voor AI (Ai2) heeft een nieuwe generatie van zijn vlaggenschipmodellen voor grote talen uitgebracht, ontworpen om beter te kunnen concurreren met zwaargewichten uit de industrie en de academische wereld.

De in Seattle gevestigde non-profitorganisatie onthulde Olmo 3een verzameling open taalmodellen die volgens hem beter presteren dan volledig open modellen zoals Stanford’s Marin en commerciële open-weight-modellen zoals Meta’s Llama 3.1.

Eerdere versies van Olmo waren voornamelijk bedoeld als wetenschappelijke hulpmiddelen om te begrijpen hoe AI-modellen worden gebouwd. Met Olmo 3 breidt Ai2 zijn focus uit en positioneert de modellen als krachtige, efficiënte en transparante systemen die geschikt zijn voor gebruik in de echte wereld, inclusief commerciële toepassingen.

“Olmo 3 bewijst dat openheid en prestaties samen vooruit kunnen gaan”, zei Ali Farhadi, de CEO van Ai2, donderdagochtend in een persbericht waarin hij de nieuwe modellen aankondigde.

Het maakt deel uit van een bredere evolutie in de AI-wereld. Het afgelopen jaar zijn steeds krachtigere open modellen van bedrijven en universiteiten – waaronder Meta, DeepSeek, Qwen en Stanford – gaan wedijveren met de prestaties van propriëtaire systemen van grote technologiebedrijven.

Veel van de nieuwste open modellen zijn ontworpen om hun redenering stap voor stap weer te geven – gewoonlijk ‘denkmodellen’ genoemd – wat een belangrijke maatstaf op dit gebied is geworden.

Ai2 brengt Olmo 3 uit in meerdere versies: Olmo 3 Base (het kernbasismodel); Olmo 3 Instrueer (afgestemd om gebruikersaanwijzingen te volgen); Olmo 3 Think (ontworpen om explicieter redeneren te tonen); en Olmo 3 RL Zero (een experimenteel model getraind met versterkend leren).

Open modellen winnen terrein bij startups en bedrijven die meer controle willen over kosten en gegevens, samen met een duidelijker inzicht in hoe de technologie werkt.

Ai2 gaat nog verder door de volledige ‘modelstroom’ achter Olmo 3 vrij te geven – een reeks momentopnamen die laten zien hoe het model door elke trainingsfase vorderde. Bovendien zal een bijgewerkte OlmoTrace-tool onderzoekers in staat stellen de redeneerstappen van een model terug te koppelen aan de specifieke gegevens en trainingsbeslissingen die hen hebben beïnvloed.

In termen van energie- en kostenefficiëntie zegt Ai2 dat het nieuwe Olmo-basismodel 2,5 keer efficiënter is om te trainen dan Meta’s Llama 3.1 (gebaseerd op GPU-uren per token, waarbij Olmo 3 Base wordt vergeleken met Meta’s 8B post-trained model). Een groot deel van deze winst komt voort uit het trainen van Olmo 3 met veel minder tokens dan vergelijkbare systemen, in sommige gevallen zes keer minder dan concurrerende modellen.

Naast andere verbeteringen zegt Ai2 dat Olmo 3 veel langere documenten in één keer kan lezen of analyseren, met ondersteuning voor invoer tot 65.000 tokens, ongeveer de lengte van een kort boekhoofdstuk.

Ai2, opgericht in 2014 door wijlen medeoprichter van Microsoft, Paul Allen, heeft lange tijd gefunctioneerd als een op onderzoek gerichte non-profitorganisatie, die open-sourcetools en -modellen ontwikkelde, terwijl grotere commerciële laboratoria de schijnwerpers domineerden. Het instituut heeft dit jaar een reeks stappen gezet om zijn profiel te verbeteren en tegelijkertijd zijn missie te behouden: het ontwikkelen van AI om de grootste problemen ter wereld op te lossen.

In augustus was Ai2 gekozen door de National Science Foundation en Nvidia voor een baanbrekend initiatief van $152 miljoen om volledig open multimodale AI-modellen voor wetenschappelijk onderzoek te bouwen, waardoor het instituut een belangrijke bijdrage kan leveren aan de AI-ruggengraat van het land.

Het fungeert ook als de belangrijkste technische partner voor de Kanker AI Alliantiewaarmee Fred Hutch en andere vooraanstaande Amerikaanse kankercentra AI-modellen kunnen trainen op basis van klinische gegevens zonder patiëntendossiers bloot te leggen.

Olmo 3 is nu beschikbaar op Hugging Face en Ai2’s modelspeeltuin.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in