Home Nieuws AI-agents werken prima, uw workflow niet

AI-agents werken prima, uw workflow niet

6
0
AI-agents werken prima, uw workflow niet

Overal zeggen besturen: “we hebben het nodig AI agenten.” Die druk verplaatst zich snel naar beneden in de organisatie. Teams bouwen een pilot en behalen goede resultaten in een sandbox. Dan proberen ze het in productie te nemen en alles vertraagt. Meestal presteerde het model prima. Wat er ontbrak was wat eromheen stond: toezicht, eigenaarschap, een plan voor als er iets misgaat.

Ik verzend al twintig jaar software in gereguleerde sectoren. In die industrieën vliegen de vliegtuigen niet en beweegt het geld niet als er iets hallucineert. Je leert dus meer om het proces te geven dan om de tools, en je realiseert je dat het model het makkelijke gedeelte is. Binnen een middag kun je de ene tegen de andere ruilen. Wat je niet kunt ruilen is de workflow die eronder zit, en de domeinkennis die is ingebakken in de manier waarop een agent daadwerkelijk beslissingen neemt.

DE WORKFLOW IS HET PRODUCT

In productie geeft u niets vrij zonder een rollback-plan. U verzamelt vanaf de eerste dag statistieken, want als u het vergeet, kunt u later geen vragen meer beantwoorden. Elke laag moet traceerbaar zijn. Er verandert niets, alleen maar omdat de code door een agent wordt geschreven in plaats van door een persoon.

Een agent in een gereguleerde omgeving heeft controle nodig over zijn beslissingslogica, gedefinieerde inputs en outputs, monitoring en een weg terug naar een veilige toestand wanneer er iets kapot gaat. Maar het moeilijker is wat daaraan voorafgaat: domeinkennis. De reden dat bedrijven jarenlang met dezelfde technische teams blijven werken, is dat die teams weten welke systemen met elkaar samenwerken, welke gebieden kwetsbaar zijn en waar kleine veranderingen plaatsvinden. Dankzij dat opgebouwde inzicht in de activiteiten, processen en het technische landschap van een klant kunt u agenten bouwen die standhouden in de productie. Zonder dit automatiseert u mogelijk processen die u niet volledig begrijpt. MIT’s onderzoek uit 2025 laat zien dat 95% van de AI-pilots op ondernemingen geen meetbare impact op het bedrijf hebben, en dat het probleem consequent is hoe organisaties AI adopteren, integreren en besturen.

AGENTEN AAN BOORD ZOALS U INGENIEURS AAN BOORD BRENGT

Je verwacht niet van een nieuwe ontwikkelaar dat hij op de eerste dag een goede feature of fix in de hoofdbranch uitvoert. Er is een aanloopperiode en toezicht. Je laat ze beginnen met kleinere taken, beoordeelt hun werk nauwkeurig en vergroot geleidelijk de reikwijdte naarmate ze bewijzen dat ze betrouwbaar kunnen presteren. Agenten hebben dezelfde behandeling nodig. Dat betekent dat ze een duidelijke ‘definition of done’ moeten krijgen, dat ze hun resultaten moeten beoordelen aan de hand van bekende benchmarks, dat iemand de resultaten moet beoordelen totdat het vertrouwen is verdiend, en dat ze een escalatiepad moeten opbouwen voor wanneer de agent iets tegenkomt dat hij niet aankan. De discipline die we decennia lang hebben opgebouwd rond het onboarden van mensen is hier ook rechtstreeks van toepassing; we hebben het alleen niet toegepast.

Stack Overflow’s ontwikkelaarsenquête uit 2025met meer dan 49.000 respondenten, ontdekte dat 45% van de ontwikkelaars zegt dat het debuggen van door AI gegenereerde code tijdrovender is dan verwacht. De uitvoer ziet er goed uit. Dan kijk je beter en dat is het niet. Een functie slaagt voor de tests, maar behandelt een randgeval op een manier die geen ervaren ingenieur zou accepteren. Dat is waar de menselijke taak naartoe gaat: niet het schrijven van code, maar het vastleggen van wat de machine bijna goed heeft gedaan. En om dat goed te doen, zijn mensen nodig die weten hoe ‘goed’ er in een bepaald domein uitziet.

BEKIJK DE BLAUWDRUK, NIET DE BAKSTENEN

Een agent kan binnen enkele seconden duizend regels code produceren. Als uw senior engineers dit allemaal achteraf beoordelen, worden ze een permanent knelpunt. Een betere aanpak zou zijn om naar links te gaan en de specificaties te bekijken voordat de agent begint. Een kleine verkeerde uitlijning in het begin verbetert snel. Tegen het einde kijk je naar een uitvoer die nauwelijks lijkt op wat de bedoeling was.

De teams begrijpen dat hun senior mensen zijn verhuisd naar iets dat dichter bij de rol van architect-supervisor ligt. Ze besteden het grootste deel van hun tijd aan het aanscherpen van de opdracht, en niet aan het inspecteren van het voltooide werk. Daarvoor zijn mensen nodig die dingen in productie hebben gebracht, die weten wat er op grote schaal kapot gaat, en die het domein goed genoeg begrijpen om specificaties te schrijven die een agent kan volgen zonder af te dwalen.

De modellen zullen op zichzelf steeds beter worden. De werkstromende vangrails, de kennis van wat er werkelijk toe doet in een specifieke branche, komen allemaal voort uit jarenlang werk.

Denis Danov is CTO bij Dreamix.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in