Home Nieuws Waarom MongoDB denkt dat beter ophalen – en niet grotere modellen –...

Waarom MongoDB denkt dat beter ophalen – en niet grotere modellen – de sleutel is tot betrouwbare zakelijke AI

2
0
Waarom MongoDB denkt dat beter ophalen – en niet grotere modellen – de sleutel is tot betrouwbare zakelijke AI

Agentsystemen en enterprise search zijn afhankelijk van krachtige gegevensophaalmogelijkheden die efficiënt en nauwkeurig werken. Databaseprovider MongoDB denkt dat het de nieuwste is inbeddingsmodellen helpen bij het oplossen van de afnemende ophaalkwaliteit naarmate er meer AI-systemen in productie gaan.

Nu Agentic- en RAG-systemen in productie gaan, wordt de kwaliteit van het ophalen steeds meer een stil faalpunt – een punt dat de nauwkeurigheid, de kosten en het gebruikersvertrouwen kan ondermijnen, zelfs als de modellen zelf goed presteren.

Het bedrijf lanceerde vier nieuwe versies van zijn inbedding en herschikking van modellen. Voyage 4 zal beschikbaar zijn in vier modi: Voyage-4 Embedding, Voyage-4-Large, Voyage-4-Lite en Voyage-4-Nano.

MongoDB zei dat de inbedding van Voyage-4 dient als model voor algemene doeleinden; MongoDB beschouwt Voyage-4-large als zijn vlaggenschipmodel. Voyage-4-lite richt zich op taken die weinig latentie en lagere kosten vereisen, en Voyage-4-nano is bedoeld voor meer lokale ontwikkel- en testomgevingen of voor het ophalen van gegevens op het apparaat.

Voyage-4-nano is ook het eerste model met open gewicht van MongoDB. Alle modellen zijn beschikbaar via een API en op het Atlas-platform van MongoDB.

Het bedrijf zei dat de modellen beter presteren dan vergelijkbare modellen van Google en Cohere op de RTEB-benchmark. Gezichten knuffelen RTEB-benchmark plaatst Voyage 4 als het beste inbeddingsmodel.

“Het inbedden van modellen is een van die onzichtbare keuzes die AI-ervaringen echt kunnen maken of breken”, zei Frank Liu, productmanager bij MongoDB, in een briefing. “Als je ze verkeerd begrijpt, zullen je zoekresultaten vrij willekeurig en oppervlakkig aanvoelen, maar als je ze goed hebt, voelt het ineens alsof je applicatie je gebruikers en je gegevens begrijpt.”

Hij voegde eraan toe dat het doel van de Voyage 4-modellen is om het ophalen van gegevens uit de echte wereld te verbeteren, wat vaak instort zodra agentic- en RAG-pijpleidingen in productie gaan.

MongoDB heeft ook een nieuw multimodaal inbeddingsmodel uitgebracht, Voyage-multimodal-3.5, dat documenten kan verwerken die tekst, afbeeldingen en video bevatten. Dit model vectoriseert de gegevens en extraheert de semantische betekenis uit de tabellen, afbeeldingen, figuren en dia’s die doorgaans in bedrijfsdocumenten voorkomen.

Inbeddingsproblemen van ondernemingen

Voor ondernemingen is een agentsysteem slechts zo goed als zijn vermogen om op betrouwbare wijze de juiste informatie op het juiste moment op te halen. Deze vereiste wordt moeilijker naarmate de workloads groter worden en de contextvensters fragmenteren.

Verschillende modelaanbieders richten zich op die laag van agentische AI. Die van Google Gemini Embedding-model bovenaan de inbeddingsklassementen, en Cohere lanceerde zijn Integreer 4 multimodale modellendat documenten van meer dan 200 pagina’s verwerkt. Mistral zei dat zijn code-inbeddingsmodel: Codestrale inbeddingpresteert beter dan Cohere, Google en zelfs MongoDB’s Voyage Code 3. MongoDB betoogt dat benchmarkprestaties alleen niet de operationele complexiteit aanpakken waarmee bedrijven in de productie te maken krijgen.

MongoDB zei dat veel klanten hebben ontdekt dat hun datastacks de contextbewuste, ophaalintensieve werklasten in de productie niet aankunnen. Het bedrijf zegt dat het meer fragmentatie ziet, waarbij bedrijven verschillende oplossingen moeten samenvoegen om databases te verbinden met een ophaal- of herrangschikkingsmodel. Om klanten te helpen die geen gefragmenteerde oplossingen willen, biedt het bedrijf zijn modellen aan via één enkel dataplatform, Atlas.

MongoDB’s weddenschap is dat het ophalen niet meer kan worden behandeld als een losse verzameling van de beste componenten. Om bedrijfsagenten betrouwbaar op schaal te laten werken, moeten inbedding, herschikking en de gegevenslaag functioneren als een nauw geïntegreerd systeem in plaats van als een aan elkaar gehechte stapel.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in