Wanneer agentische workflows mislukken, gaan ontwikkelaars er vaak van uit dat het probleem ligt in het redeneervermogen van het onderliggende model. In werkelijkheid is de beperkte informatie die door de ophaalinterface wordt verstrekt vaak de belangrijkste beperkende factor.
Onderzoekers van meerdere universiteiten stellen een techniek voor genaamd directe corpusinteractie (DCI) waarmee agenten het inbedden van modellen volledig kunnen omzeilen en onbewerkte corpora rechtstreeks kunnen doorzoeken met behulp van standaard opdrachtregelprogramma’s.
De grenzen van klassiek ophalen
In klassieke ophaalsystemen zoals RAGworden documenten in delen opgedeeld, omgezet in vectorrepresentaties (of inbedding) en offline geïndexeerd in een vectordatabase. Wanneer een AI-systeem een zoekopdracht verwerkt, filtert een retriever de hele database om een gerangschikte ’top-k’-lijst met documentfragmenten terug te geven die overeenkomen met de zoekopdracht. Al het bewijsmateriaal moet dit scoremechanisme passeren voordat er een stroomafwaartse redenering plaatsvindt.
Maar moderne agent-applicaties vereisen veel meer. “Dense retrieval is erg handig voor een brede semantische herinnering, maar wanneer een agent een uit meerdere stappen bestaande taak moet oplossen, moet hij vaak zoeken naar exacte tekenreeksen, getallen, versies, foutcodes, bestandspaden of spaarzame combinaties van aanwijzingen”, aldus de auteurs van het DCI-artikel in commentaar aan VentureBeat. “Deze lange staartdetails zijn precies waar semantische gelijkenis broos kan zijn.”
In tegenstelling tot statische zoekopdrachten moeten agenten hun zoekplannen ook dynamisch herzien nadat ze gedeeltelijk of gelokaliseerd bewijsmateriaal hebben waargenomen. Exacte lexicale beperkingen en verfijning van hypothesen in meerdere stappen zijn moeilijk uit te voeren met semantische retrievers. Omdat de retriever de toegang in één enkele stap comprimeert, kan eventueel kritisch bewijsmateriaal dat door het zoeken naar gelijkenissen wordt uitgefilterd, later niet meer worden hersteld, ongeacht hoe geavanceerd de downstream-redeneringsmogelijkheden van de agent zijn. Zoals de auteurs uitleggen, kunnen de huidige ophaalpijplijnen een knelpunt worden omdat “ze te vroeg beslissen wat de agent mag zien.”
Directe corpusinteractie
Deze directe toegang pakt een kernprobleem in bedrijfsomgevingen aan: data-veroudering. Het insluiten van indexen is altijd een momentopname van een specifiek moment en vergt veel rekenkracht en tijd om te bouwen en te onderhouden.
“In veel bedrijfsomgevingen vormen de gegevens geen stabiele documentverzameling. Het zijn dagelijkse financiële rapporten, live logs, tickets, code-commits, configuratiebestanden, incidenttijdlijnen en interne documenten die blijven veranderen”, aldus de auteurs. Met DCI kan de agent redeneren over de huidige status van de werkruimte in plaats van over de vectorindex van gisteren.
De agent werkt in een terminalachtige omgeving waar zijn observaties ruwe tooluitvoer zijn, zoals bestandspaden, overeenkomende tekstreeksen en omringende regels. De kerninstrumenten van DCI zijn beperkt, maar zeer expressief. Agenten gebruiken opdrachten als “find” en “glob” om door mapstructuren te navigeren en bestanden te lokaliseren. Voor exacte matching gebruiken ze “grep” en “rg” om specifieke trefwoorden, regex-patronen en exacte tekenreeksen te lokaliseren. Wanneer lokale inspectie nodig is, kunnen tools als ‘head’, ‘tail’, ‘sed’, ‘cat’ en lichtgewicht Python-scripts de agent in staat stellen om naar de context rond een overeenkomst te kijken of specifieke bestandssecties te lezen.
De agent kan deze tools via shell-pijplijnen combineren om complexe zoeklogica in één stap uit te voeren. Een agent kan commando’s doorsluizen om strikte lexicale beperkingen af te dwingen, zoals het doorzoeken van een bestand op één term en het doorzoeken van de uitvoer om naar een tweede term te zoeken. Het kan meerdere zwakke aanwijzingen in een corpus combineren door een specifiek bestandstype te vinden, te zoeken naar een trefwoord als ‘rapport’ en te filteren op een jaar als ‘2024’. Het kan een hypothese ook onmiddellijk verifiëren door de exacte regels rond een zoekwoordovereenkomst te inspecteren.
DCI delegeert semantische interpretatie rechtstreeks aan de agent in plaats van te vertrouwen op op insluitingen gebaseerde overeenkomstenzoekopdrachten. De agent kan hypothesen formuleren, exacte lexicale patronen testen en gedetailleerde informatie extraheren die een traditionele semantische retriever misschien over het hoofd zou zien.
De onderzoekers stellen twee versies van dit systeem voor. DCI-Agent-Lite is ontworpen als een lichtgewicht, goedkope installatie, gebouwd op het GPT-5.4 nano-model en puur beperkt tot onbewerkte terminalinteracties zoals bash-opdrachten en het lezen van basisbestanden. Omdat het lezen van onbewerkte bestanden het geheugen van een kleiner model snel kan vullen, vertrouwt deze versie op lichtgewicht runtime-contextbeheerstrategieën om verkenning over de lange horizon mogelijk te maken.
DCI-Agent-CC is de versie met hogere prestaties, ontworpen voor teams met meer rekenbudget. Het loopt door Claude Code aangedreven door Claude Sonnet 4.6. Claude Code biedt sterkere aanwijzingen, robuustere toolorkestratie en superieure ingebouwde contextverwerking, waardoor de stabiliteit van de agent wordt verbeterd tijdens complexe, uit meerdere stappen bestaande zoekopdrachten in heterogene datasets.
DCI in actie
De onderzoekers testten beide versies van DCI in agentische zoekbenchmarks zoals BrowseComp-Plus, kennisintensieve QA met single-hop en multi-hop redenering, en rangschikking van het ophalen van informatie bij taken die domeinspecifieke redenering en wetenschappelijke factchecking vereisen.
Ze testten DCI tegen drie basislijnen. De eerste omvatte ophaalmiddelen met een open gewicht, zoals Zoeken-R1 en eigen agenten die worden aangedreven door grensverleggende modellen zoals GPT-5 en Claude Sonnet 4.6, gecombineerd met standaard retrievers. De tweede basislijn omvatte klassieke sparse retrievers zoals BM25 en compact retrievers zoals OpenAI’s text-embedding-3-large en Qwen3-Embedding-8B. De derde basislijn bestond uit goed presterende, op redeneren gerichte re-rankers zoals ReasonRank-32B en Rank-R1.
DCI presteerde systematisch beter dan de uitgangswaarden, volgens de onderzoekers. Op de complexe BrowseComp-Plus benchmark verbeterde het vervangen van een traditionele Qwen3 semantische retriever voor DCI op een Claude Sonnet 4.6-backbone de nauwkeurigheid van 69,0% naar 80,0%, terwijl de API-kosten werden verlaagd van $1.440 naar $1.016. Het rendement op de investering voor lichtgewicht agenten was ook merkbaar. DCI-Agent-Lite met GPT-5.4 nano concurreerde met het OpenAI o3-model met behulp van traditioneel ophalen, terwijl de kosten met meer dan $ 600 werden verlaagd.
Op multi-hop QA-benchmarks bereikte DCI-Agent-CC een gemiddelde nauwkeurigheid van 83,0%, wat volgens de onderzoekers een verbetering was ten opzichte van de sterkste open-weight retrieval-basislijn met 30,7 punten.
Uit de gegevens blijkt dat DCI over het algemeen een lagere documentherinnering heeft dan modellen met dichte inbedding, maar zodra het een relevant document vindt, haalt het er aanzienlijk meer waarde uit.
“Als een AI-leider van een onderneming zou vragen waar DCI het duidelijkst nuttig is, zou ik wijzen op taken die exacte lokalisatie van bewijsmateriaal vereisen in een dynamische werkruimte: het debuggen van productie-incidenten, het doorzoeken van grote codebases, het analyseren van logboeken, compliance-onderzoek, audittrails of analyse van de hoofdoorzaak van meerdere documenten”, merken de onderzoekers op.
In een complexe, diepgaande onderzoekstaak moest de agent een specifieke voetbalwedstrijd identificeren op basis van twaalf in elkaar grijpende aanwijzingen, waaronder de exacte opkomst, gele kaarten en geboortedata van de speler. Een traditionele retriever zou falen als hij korte, losstaande fragmenten naar boven zou halen. In plaats daarvan verkende de DCI-agent de bestandsmap, las specifieke regels van een wedstrijdverslag tussen Engeland en België uit 1990 om het exacte aantal wissels te verifiëren, haalde een specifiek citaat uit een interviewbestand en verifieerde de exacte geboortedata van twee spelers door in hun Wikipedia-tekstbestanden te kijken. Door deze eenvoudige opdrachten aan elkaar te koppelen, zorgt DCI ervoor dat er geen bewijsmateriaal permanent verloren gaat achter een gebrekkig semantisch zoekalgoritme.
Grenzen en praktische implementatie van DCI
DCI heeft een duidelijk operationeel bereik waarbij het uitstekend schaalt in zoekdiepte, maar moeite heeft met zoekbreedte. Toen het experimentele corpus werd uitgebreid van 100.000 naar 400.000 documenten, daalde de nauwkeurigheid van het systeem aanzienlijk en steeg het gemiddelde aantal tool calls. Hoewel DCI krachtig is zodra een veelbelovend document is gevonden, stijgen de kosten voor het lokaliseren van dat eerste bruikbare ankerdocument sterk naarmate de omvang van de kandidaatruimte toeneemt.
DCI heeft ook een lagere brede documentherinnering vergeleken met modellen met dichte inbedding. Het ruilt een uitgebreide terugroepactie in voor lokale precisie met hoge resolutie. Als een bedrijfsworkflow strikt vereist dat elk afzonderlijk relevant document in een enorme dataset moet worden gevonden, is DCI wellicht niet het juiste hulpmiddel.
Door een agent expressieve tools toe te kennen, zoals een onbeperkte bash-shell, worden de latentie en de rekenkosten verhoogd vanwege het grote aantal iteratieve toolaanroepen dat nodig is om een zoekopdracht te voltooien. Het zorgt ook voor aanzienlijke uitdagingen op het gebied van contextbeheer en beveiliging voor IT-afdelingen.
“Tooloproepen kunnen grote resultaten opleveren; lange trajecten kunnen het contextvenster vullen; en onbewerkte terminaltoegang vereist sandboxing, toestemmingscontrole en zorgvuldige engineering”, aldus de auteurs. Om het contextvenster te beheren, ontdekten de onderzoekers dat gematigde afkapping en verdichting de agent helpen langere zoekopdrachten vol te houden, terwijl te agressieve samenvattingen de neiging hebben om bruikbaar bewijsmateriaal terzijde te schuiven.
Vanwege deze operationele realiteit is DCI niet bedoeld als verplichte vervanging voor de bestaande vectorinfrastructuur. In plaats daarvan dient het als een aanvulling.
“Voor orkestratie-ingenieurs en data-architecten is onze mening dat het meest praktische implementatiepatroon op de korte termijn hybride is”, aldus de auteurs. Semantisch ophalen kan nog steeds een hoge mate van herinnering aan kandidaten opleveren wanneer de intentie van een gebruiker breed of te weinig gespecificeerd is. “DCI kan dan functioneren als een precisie- en verificatielaag: de agent kan binnen de opgehaalde documenten zoeken, van daaruit uitbreiden naar aangrenzende bestanden, de exacte beperkingen controleren en zwakke signalen tussen documenten combineren.”
De onderzoekers hebben vrijgegeven de code voor DCI onder de permissieve MIT-licentie.
“Op de langere termijn verandert DCI de manier waarop we over bedrijfsgegevens denken. Gegevens zullen niet alleen voor mensen moeten worden opgeslagen of geïndexeerd voor zoekmachines; ze zullen ook moeten worden georganiseerd voor agenten die kunnen inspecteren, vergelijken, grep, traceren en verifiëren”, concluderen de auteurs. “Bestandsnamen, tijdstempels, stabiele identificatiegegevens, metadata, versiegeschiedenis en machinaal leesbare structuur worden onderdeel van de ophaalinterface.”



