Home Nieuws De retrieval-rebuild: waarom de intentie van hybride retrieval verdrievoudigde toen RAG-programma’s van...

De retrieval-rebuild: waarom de intentie van hybride retrieval verdrievoudigde toen RAG-programma’s van bedrijven op de schaalmuur stuitten

3
0
De retrieval-rebuild: waarom de intentie van hybride retrieval verdrievoudigde toen RAG-programma’s van bedrijven op de schaalmuur stuitten

Er is iets veranderd in de zakelijke RAG in het eerste kwartaal van 2026. VB Pulse-gegevens van januari tot en met maart vertellen een consistent verhaal: de markt stopte met het toevoegen van ophaallagen en begon met het repareren van de lagen die ze al had. Noem het de retrieval-rebuild.

Het onderzoek omvatte drie opeenvolgende maandelijkse golven van organisaties met 100 of meer werknemers, met tussen de 45 en 58 gekwalificeerde respondenten per maand op het gebied van platformacceptatie, kopersintentie, architectuurvooruitzichten en evaluatiecriteria. De gegevens moeten als directioneel worden behandeld.

De intentie van bedrijven om hybride ophaalsystemen te adopteren is in één kwartaal verdrievoudigd van 10,3% naar 33,3%, terwijl 22% van de gekwalificeerde zakelijke respondenten aangaf helemaal geen productie-RAG-systemen te hebben. Voor data-ingenieurs en enterprise-architecten die een AI-infrastructuur bouwen, onthullen de data een markt in actieve transitie: de RAG-architectuur die de meeste bedrijven op schaal bouwen, is niet degene die ze verwachten tegen het einde van het jaar te hebben.

Credit: VentureBeat Pulse-enquête

Hybride ophalen is de consensusstrategie voor ondernemingen geworden. In tegenstelling tot RAG-pijplijnen met één methode die alleen afhankelijk zijn van vectorgelijkenis, combineert hybride ophalen een dichte inbedding met schaarse trefwoordzoek- en herschikkingslagen, waarbij eenvoud wordt ingewisseld voor de ophaalnauwkeurigheid en toegangscontrole die productieagentische werklasten vereisen.

De categorie zelfstandige vectordatabases staat onder druk. Weaviate, Milvus, Pinecone en Qdrant verloren elk dit kwartaal een adoptieaandeel in de VB Pulse-gegevens. Custom stacks en provider-native retrieval absorberen hun verplaatste aandeel.

Een groeiende minderheid van bedrijven doet helemaal afstand van RAG – een signaal dat het volwassenheidsverhaal van de markt betekenisvolle uitzonderingen kent.

Organisaties die in 2025 breed op RAG zijn ingegaan, stuiten op hetzelfde faalpunt: de architectuur die is gebouwd voor het ophalen van documenten houdt geen stand op agentische schaal.

Bedrijven die RAG snel hebben opgeschaald, betalen nu om het opnieuw op te bouwen

De twee grootste intentiebewegingen in het eerste kwartaal houden rechtstreeks verband met elkaar: bedrijven worden op grote schaal geconfronteerd met problemen met de kwaliteit van het ophalen, en hybride ophalen komt naar voren als het consensusantwoord.

De investeringsprioriteiten verschoven parallel. Evaluatie en relevantietests brachten de begrotingsintentie in januari op 32,8% en daalden naar 15,6% in maart. De retrieval-optimalisatie bewoog zich in de tegenovergestelde richting, van 19,0% naar 28,9%, waardoor de evaluatie voor het eerst werd ingehaald als het belangrijkste groei-investeringsgebied.

VB RAG onderzoekt investeringsprioriteiten

Credit: VentureBeat Pulse-enquête

Steven Dickens, vice-president en praktijkleider bij HyperFRAME Research, beschreef de operationele lasten waarmee bedrijfsdatateams worden geconfronteerd in een VentureBeat-interview in maart op De agentische AI-datastack van Oracle. “Datateams zijn uitgeput door fragmentatiemoeheid”, zegt Dickens. “Het beheren van een afzonderlijke vectoropslag, grafische database en relationeel systeem, alleen maar om één agent aan te drijven, is een DevOps-nachtmerrie.”

Die vermoeidheid blijkt direct uit de platformgegevens. De stijging van de aangepaste stapel naar 35,6% is geen afwijzing van beheerd ophalen; veel organisaties gebruiken beide. Het is een consolidatiereactie van technische teams die de grenzen van het assembleren van te veel componenten hebben bereikt.

Niet ieder bedrijf is zo ver gekomen. De VB Pulse-gegevens bevatten een signaal dat het algemene groeiverhaal van de markt compliceert: 22,2% van de gekwalificeerde respondenten rapporteerde in maart geen productie-RAG, vergeleken met 8,6% in januari. Het rapport schrijft dit cohort toe aan organisaties die “nog geen enkele retrieval-infrastructuur hebben opgezet, of programma’s hebben stopgezet” – geconcentreerd in de gezondheidszorg, het onderwijs en de overheid, dezelfde sectoren met de hoogste percentages vaste budgetten.

Op zichzelf staande vectordatabases verliezen het acceptatieargument, maar winnen het betrouwbaarheidsargument

Recente rapporten van VentureBeat illustreren waarom de speciale ophaallaag nog steeds van belang is in de productie.

Twee bedrijven die voortbouwen op Qdrant laten zien waarom speciaal gebouwde vectorinfrastructuur nog steeds wint in de productie.

&AI bouwt infrastructuur voor octrooigeschillen en voert semantisch onderzoek uit in honderden miljoenen documenten. Het onderbouwen van elk resultaat in een echt brondocument is niet optioneel; octrooigemachtigden zullen niet handelen op basis van door AI gegenereerde tekst. Die eis maakt de architectonische keuze helder.

“De agent is de interface”, vertelde Herbie Turner, oprichter en CTO van &AI, in maart aan VentureBeat. “De vectordatabase is de grondwaarheid.”

GlassDollar, een startup die Siemens en Mahle helpt startups te evalueren, voert een agentisch ophaalpatroon uit over een corpus van bijna 10 miljoen geïndexeerde documenten. Eén enkele gebruikersprompt waaiert uit in meerdere parallelle zoekopdrachten, waarbij elke kandidaat vanuit een andere hoek wordt opgehaald voordat de resultaten worden gecombineerd en opnieuw gerangschikt. Dat queryvolume en de vereiste nauwkeurigheid hebben geleid tot de keuze voor een speciaal gebouwde vectorinfrastructuur.

“We meten succes aan de hand van de herinnering”, vertelde Kamen Kanev, hoofd product van GlassDollar, in maart aan VentureBeat. “Als de beste bedrijven niet in de resultaten staan, doet niets anders ertoe. De gebruiker verliest het vertrouwen.”

Uit de gegevens van VB Pulse blijkt dat framing – ophalen als grondwaarheid in plaats van als kenmerk – steeds meer terrein wint in de bredere zakelijke markt, zelfs nu de acceptatie van standalone vectordatabases afneemt.

Waarom bedrijven zeggen dat ze een speciale vectorlaag nodig hebben, is in het eerste kwartaal aanzienlijk verschoven. In januari waren de belangrijkste redenen de complexiteit van de toegangscontrole (20,7%) en de nauwkeurigheid van het ophalen (19,0%). In maart was de operationele betrouwbaarheid op grote schaal gestegen tot 31,1%, wat meer dan een verdubbeling is en al het andere inhaalt. Bedrijven houden hun vectorinfrastructuur niet langer in de eerste plaats voor precisie. Ze behouden het omdat dit het deel van de stapel is waarop ze kunnen vertrouwen wanneer queryvolumes worden geschaald.

Hoe bedrijven opnieuw definiëren wat goed terughalen betekent

De manier waarop bedrijven hun ophaalsystemen beoordelen, is in het eerste kwartaal aanzienlijk veranderd – en de richting van die verschuiving wijst erop dat de markt steeds geavanceerder wordt over wat goed ophalen eigenlijk betekent.

In januari domineerde de correctheid van de antwoorden de evaluatiecriteria met 67,2% – ver boven al het andere. In maart waren de correctheid van het antwoord (53,3%), de nauwkeurigheid van het ophalen (53,3%) en de relevantie van het antwoord (53,3%) precies samengekomen. Het juiste antwoord krijgen is niet langer voldoende als het uit het verkeerde document komt of de context van de vraag mist.

De antwoordrelevantie was het enige criterium dat gedurende het kwartaal steeg, met een winst van vijf procentpunten. Het is ook het moeilijkst te meten: of de opgehaalde context daadwerkelijk de juiste context is voor die specifieke vraag vereist een speciaal gebouwde evaluatie-infrastructuur, en niet alleen maar controles op de juistheid of het wel of niet slagen ervan. De stijging wijst erop dat een aanzienlijk deel van de zakelijke kopers de basis-RAG-testen volledig voorbij is gegaan.

VB RAG enquête topevaluatie

Credit: VentureBeat Pulse-enquête

Het oordeel van de markt: RAG is niet dood. De oorspronkelijke architectuur is

Het ‘RAG is dood’-verhaal had een echte impuls richting 2026. Het berustte op twee beweringen. De eerste: dat lange-contextvensters – modellen die honderdduizenden tokens in één enkele prompt kunnen verwerken – speciaal opvragen overbodig zouden maken. De tweede: dat agentische geheugensystemen, die opslaan wat een agent tijdens sessies leert in plaats van het elke keer opnieuw op te halen, het probleem van de toegang tot kennis volledig zouden absorberen.

De VB Pulse-gegevens zijn het antwoord van de zakelijke markt op de eerste claim. De positie van de lange context als dominante architectuur stortte in van 15,5% in januari naar 3,5% in februari, voordat hij zich in maart gedeeltelijk herstelde tot 6,7%. De steekproef van januari was zwaar gewogen in de richting van technologie- en softwarerespondenten – het segment dat eind 2025 het meest werd blootgesteld aan aankondigingen van lange-contextmodellen. Naarmate de steekproef diversifieerde, verdampte de positie.

Wat betreft de geheugenvraag heeft Jonathan Frankle, hoofd AI-wetenschapper bij Databricks, de architectuur duidelijk in een kader gezet Maart interview met VentureBeat: een vectordatabase met miljoenen vermeldingen bevindt zich aan de basis van de agentische geheugenstapel, te groot om in de context te passen. Het LLM-contextvenster bevindt zich bovenaan. Daartussen ontstaan ​​nieuwe caching- en compressielagen, maar geen enkele vervangt de ophaallaag aan de basis. Nieuwe agentische geheugensystemen zoals Hindsight, ontwikkeld door Vectorize, en observationele geheugenbenaderingen zoals die in het Mastra-framework richten zich op sessiecontinuïteit en agentcontext in de loop van de tijd – een ander probleem dan zoeken met hoge herinneringen in miljoenen veranderende bedrijfsdocumenten.

Het meest consequente signaal: het percentage respondenten dat tegen het einde van het jaar geen grootschalige RAG-implementaties verwachtte, groeide van 3,4% naar 15,6% – bijna 5x. Dat is geen oordeel tegen terugvordering. Het is een oordeel tegen de ophaalarchitectuur die de meeste ondernemingen als eerste hebben gebouwd.

VB RAG-onderzoek verwachtte dominante architectuur

Credit: VentureBeat Pulse-enquête

Het opnieuw opbouwen van het herstel is niet optioneel

Het opnieuw opbouwen van het herstel is de kosten van het schalen van RAG zonder eerst te beslissen welke architectuur het daadwerkelijk zou kunnen ondersteunen.

Als uw organisatie tot de 43,1% behoort die de planning voor het eerste kwartaal heeft ingevoerd om RAG uit te breiden naar meer workflows, duiden de gegevens van VB Pulse erop dat het plan voor veel van uw collega’s al is gewijzigd – en mogelijk ook voor u moet veranderen. Hybride ophalen is de consensusbestemming. De groei van de custom stack naar 35,6% weerspiegelt dat teams een retrieval-infrastructuur bouwen rond vereisten die kant-en-klare producten niet volledig vervullen.

RAG is niet dood. De architectuur die de meeste bedrijven gebruikten om het te implementeren is. Uit de gegevens blijkt dat de herbouw geen toekomstige beslissing is. Voor 33% van de ondernemingen is de wederopbouw al de aangegeven prioriteit.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in