Home Nieuws Contextarchitectuur vervangt RAG nu agentische AI ​​het bedrijfsherstel tot het uiterste drijft

Contextarchitectuur vervangt RAG nu agentische AI ​​het bedrijfsherstel tot het uiterste drijft

4
0
Contextarchitectuur vervangt RAG nu agentische AI ​​het bedrijfsherstel tot het uiterste drijft

Redis heeft zijn naam opgebouwd als de cachinglaag die ervoor zorgt dat webapplicaties niet bezwijken onder belasting. Het probleem waar het zich nu op richt heeft dezelfde structuur, maar is moeilijker op te lossen: productie-AI-agenten falen niet omdat de modellen verkeerd zijn, maar omdat de gegevens daaronder verspreid, oud en gestructureerd zijn voor mensen in plaats van voor machines. Ophaalpijplijnen die zijn gebouwd voor afzonderlijke zoekopdrachten kunnen het volume dat agenten genereren niet absorberen.

De kloof waarop Redis zich richt is structureel: agenten doen meer gegevensverzoeken dan menselijke gebruikers, maar de meeste lagen voor het ophalen van gegevens zijn gebouwd voor het probleem op menselijke schaal. Redis Iris, dat maandag werd gelanceerd, is het antwoord van het bedrijf: een context- en geheugenplatform dat zich tussen een agent en de gegevens bevindt die hij nodig heeft om te handelen. Het platform combineert real-time gegevensopname, een semantische interface die automatisch MCP-tools genereert op basis van bedrijfsgegevensmodellen, en een agentgeheugenserver gebouwd op Redis Flex, een herschreven opslagengine die 99% van de gegevens op flash draait tegen een tiende van de kosten van alleen al in-memory-opslag.

De aankondiging komt terecht op het moment dat de zakelijke RAG-infrastructuur zich in een actieve transitie bevindt. VentureBeat’s Q1 2026 VB Pulse RAG Infrastructure Market Tracker constateerde dat de intentie van kopers om hybride ophaalmogelijkheden toe te passen tussen januari en maart verdrievoudigde van 10,3% naar 33,3%. Ophaaloptimalisatie overtrof voor het eerst evaluatie als topprioriteit voor bedrijfsinvesteringen. Op maat gemaakte in-house ophaalstapels stegen van 24,1% naar 35,6%, omdat bedrijven de kant-en-klare opties ontgroeiden. Redis is niet de enige infrastructuurleverancier die deze signalen leest; verschillende dataplatformaanbieders hebben zich de afgelopen weken geherpositioneerd rond agentcontextlagen.

De schaalmismatch is het structurele argument achter de lancering. “Bedrijven zullen ordes van grootte meer agenten hebben dan mensen”, zegt Rowan Trollope, CEO van Redis. VentureBeat. “Orden van grootte meer agenten dan mensen betekenen orden van grootte meer belasting van back-endsystemen.”

Van cache tot context

Trollope traceert de parallel terug naar het mobiele tijdperk: toen verouderde backends gebouwd voor filiaaltellers plotseling een miljoen smartphonegebruikers moesten bedienen, werd Redis de cachinglaag die de belasting absorbeerde zonder een volledige herbouw.

Wat deze keer anders is, is dat agenten hun eigen middleware niet kunnen schrijven. In het mobiele tijdperk zat een ontwikkelaar samen met een databasebeheerder, identificeerde de vragen die een applicatie nodig had en codeerde de caching-logica hard in een middleware-laag. Agenten kunnen dat niet doen. Ze moeten de juiste gegevens tijdens runtime vinden, via interfaces die vooraf voor hen zijn gebouwd, anders lopen ze vast.

“Dit lijkt op de analogie van de supermarkt in de koelkast”, zei hij. “Als je elke keer dat je je boterham moet gaan maken, naar de supermarkt moet rennen om het eten te halen, is dat niet erg efficiënt. Je zet in elk huis een koelkast en daar bewaar je een klein beetje voedsel. En dat is een beetje waar we nog steeds de neiging hebben om in de infrastructuur te bestaan.”

Wat Redis Iris inhoudt

Iris levert vijf componenten die samen gegevensopname, semantische toegang, geheugen en caching omvatten.

Redis-gegevensintegratie. Nu algemeen verkrijgbaar. RDI maakt gebruik van pipelines voor het vastleggen van wijzigingsgegevens om gegevens uit relationele databases, magazijnen en documentarchieven continu te synchroniseren met Redis, met connectoren voor Oracle, Snowflake, Databricks en Postgres.

Context ophalen. Nu in voorproefje. Ontwikkelaars definiëren een semantisch model van bedrijfsgegevens met behulp van pydantische modellen en Redis genereert automatisch MCP-tools die agenten gebruiken om deze rechtstreeks op te vragen, waarbij toegangscontroles op rijniveau aan de serverzijde worden afgedwongen. Trollope beschrijft de verschuiving van de klassieke RAG als een directionele inversie. “Het is gewoon een ommekeer om de agent de gegevens te laten ophalen in plaats van te veronderstellen en deze in de pijplijn te stoppen”, zei hij.

Agentgeheugen. Nu in voorproefje. Slaat de korte- en langetermijnstatus van sessies op, zodat agenten context kunnen meenemen zonder deze elke beurt opnieuw te moeten herleiden.

Redis Flex. Een herschreven opslagengine die 99% van de gegevens op SSD’s en 1% in RAM uitvoert, en op petabyteschaal kan ophalen met een latentie van minder dan een milliseconde.

Redis Search en LangCache. De ophaal- en semantische caching-backbone onder het platform. LangCache vermindert overbodige modelaanroepen door promptreacties in de cache op te slaan.

Wat analisten zeggen

De data-industrie gaat nu over het algemeen dezelfde kant op. Elke grote databaseleverancier maakt een contextlaagargument.

Traditionele databaseleveranciers inclusief Orakel integreren context- en geheugenlagen om relationele databases in het agentische AI-tijdperk te brengen. Speciaal gebouwde vectordatabaseleveranciers, waaronder Dennenappel doen hetzelfde en bouwen een nieuwe kennislaag uit voor agentische AI-context. Op zichzelf staande contextlagen zoals Achteraf gezien maken ook deel uit van het opkomende landschap.

Trollope beschouwt de positie van Redis als structureel verschillend van die van de concurrentie.

‘Als wij willen winnen, hoeft niemand anders te verliezen’, zei hij. Veel Redis-implementaties draaien al op MongoDB of Oracle als het backend-systeem. Iris reflecteert en cachet deze systemen in plaats van ze te verplaatsen. Redis lanceert Iris op de Snowflake-marktplaats met native connectoren.

Stephanie Walter, Practice Leader voor AI Stack bij HyperFRAME Research, zet de marktcontext duidelijk uiteen. “De markt komt tot dezelfde conclusie: agenten hebben niet alleen meer tokens of betere modellen nodig. Ze hebben een beheerste, actuele context met lage latentie nodig”, aldus Walter.

Haar lezing over de differentiatie van Redis richt zich op waar Redis zich al in de stapel bevindt, wat dicht bij runtime, latentiegevoelige operationele status en realtime gegevens ligt.

“Het veld is niet zozeer een ‘betere RAG’, maar ‘agenten hebben live context, geheugen en snel ophalen nodig terwijl ze daadwerkelijk aan het werk zijn’, zei ze.

Of het nu Redis is of een andere leverancier, elke contextlaagtechnologie zal te maken krijgen met een governance-uitdaging om succesvol te zijn.

“Agentic AI zal niet opschalen in de onderneming als elke agent een nieuwe kostenplaats, een nieuw risico op gegevenstoegang en een nieuwe governance-uitzondering wordt”, zei ze. “De winnende contextlagen zullen degene zijn die ervoor zorgen dat agenten sneller, goedkoper en veiliger kunnen werken.”

Voor real-time klinische AI ​​is het verkeerd interpreteren van de context geen optie

Mangoes.ai is een bedrijf dat deze vragen al in de productie heeft moeten beantwoorden, onder omstandigheden waarin de kosten van het verkeerd krijgen van de context worden gemeten in de patiëntresultaten.

Amit Lamba, oprichter en CEO van Mangoes.ai, beheert een realtime stem-AI-platform dat wordt ingezet in grote zorginstellingen waar patiënten en artsen live vragen stellen over de behandeling, planning en casusgeschiedenis. Mangoes.ai heeft zijn stack vanaf het begin native op Redis gebouwd.

“Ophaal-, geheugen- en sessiestatus lopen allemaal via Redis, dus we voegen geen afzonderlijke tools samen in de hoop dat ze met elkaar praten”, zei Lamba.

Het probleem dat de dynamische geheugencapaciteit van Iris aanpakt, is wat er tijdens een complexe sessie gebeurt.

‘Denk eens aan een groepstherapiesessie van een uur,’ zei Lamba. “Je moet weten wie wat heeft gezegd, wanneer, en in staat zijn om op dat moment de juiste informatie aan de therapeut te geven. Dat is geen eenvoudig terugvindingsprobleem.”

Het platform voert meerdere gespecialiseerde agenten parallel uit, één voor entiteitsidentificatie, één voor relatieredenering en één voor het integreren van casusgeschiedenis. “De dynamische geheugencapaciteit komt bijna perfect overeen met het probleem dat we oplossen”, zegt Lamba.

Wat dit betekent voor bedrijven

Voor bedrijven die hun AI-stack rond RAG hebben gebouwd, is de ophaallaag die hen naar productie bracht niet langer voldoende om ze daar te houden

Het RAG-tijdperk maakt plaats voor contextarchitectuur. Het klassieke RAG-model pushte gegevens naar de agent voordat het model werd aangeroepen. Productie-implementaties draaien dat om: agenten halen tijdens runtime op wat ze nodig hebben via tooloproepen, waarbij de gegevenslaag wordt behandeld als een live bron in plaats van als een vooraf geladen payload. Teams die nog steeds RAG-pijpleidingen optimaliseren, lossen het probleem van vorig jaar op.

De semantische laag is nu de productie-infrastructuur. Het model dat bedrijfsentiteiten, hun relaties en de toegangsregels daartussen definieert, moet worden gebouwd, geversieerd en onderhouden met dezelfde discipline als een datapijplijn. De meeste organisaties beschikken niet over personeel of structuur voor dat werk. De ondernemingen die nu hun contextarchitectuur definiëren, zullen deze niet opnieuw hoeven op te bouwen wanneer de werklasten van agenten toenemen.

De begroting is al in beweging. Uit gegevens van VB Pulse over het eerste kwartaal van 2026 blijkt dat de investeringen in retrieoptimalisatie zijn gestegen van 19% naar 28,9% over het kwartaal, waarmee ze voor het eerst de evaluatie-uitgaven hebben ingehaald. Organisaties die het afgelopen jaar hun ophaalkwaliteit hebben gemeten, besteden nu geld aan het repareren ervan. De contextlaag is een actieve inkoopbeslissing en geen routekaartitem.

“De eerste kopersvraag zou niet moeten zijn: ‘Heb ik een vectordatabase, lange context, geheugen of een contextengine nodig?’ Het zou moeten zijn: ‘Wat moet deze agent weten, hoe actueel moet die kennis zijn, wie heeft er toegang toe en wat kost elk ophalen?'” zei Walter.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in