2025 had toch het jaar van de AI-agent moeten zijn?
Niet helemaal, erken Google Cloud en Replit – twee grote spelers op het gebied van AI-agenten en partners in de ‘Vibe-codering“beweging – tijdens een recent VB Impact Series-evenement.
Zelfs nu ze zelf agententools ontwikkelen, zeggen de leiders van de twee bedrijven dat de mogelijkheden er nog niet helemaal zijn.
Deze beperkte realiteit komt neer op de strijd met verouderde workflows, gefragmenteerde gegevens en onvolwassen bestuursmodellen. Bovendien begrijpen bedrijven fundamenteel verkeerd dat agenten niet zijn zoals andere technologieën: ze vereisen een fundamentele heroverweging en herwerking van workflows en processen.
Wanneer bedrijven agenten bouwen om het werk te automatiseren, “zijn de meeste speelgoedvoorbeelden”, zei Amjad Masad, CEO en oprichter van Replit, tijdens het evenement. “Ze raken enthousiast, maar als ze het gaan uitrollen, werkt het niet echt goed.”
Agenten bouwen op basis van Replit’s eigen fouten
Betrouwbaarheid en integratie, en niet de intelligentie zelf, zijn twee belangrijke obstakels voor het succes van AI-agenten, merkte Masad op. Agents falen vaak als ze langere tijd worden gebruikt, accumuleren fouten of hebben geen toegang tot schone, goed gestructureerde gegevens.
Het probleem met bedrijfsgegevens is dat ze rommelig zijn (het is gestructureerd, ongestructureerd en overal opgeslagen) en het crawlen ervan is een uitdaging. Bovendien zijn er veel ongeschreven dingen die mensen doen die moeilijk te coderen zijn in agenten, zei Masad.
“Het idee dat bedrijven alleen maar agenten gaan inschakelen en dat agenten werknemers zullen vervangen of automatisch workflowautomatiseringen zullen uitvoeren, is vandaag de dag gewoon niet het geval”, zei hij. “De tooling is er niet.”
Een stap verder dan agenten zijn de tools voor computergebruik, die de werkruimte van een gebruiker kunnen overnemen voor basistaken zoals surfen op het web. Maar deze staan nog in de kinderschoenen en kunnen, ondanks de versnelde hype, buggy, onbetrouwbaar en zelfs gevaarlijk zijn.
“Het probleem is dat modellen voor computergebruik momenteel erg slecht zijn”, zegt Masad. “Ze zijn duur, ze zijn traag, ze boeken vooruitgang, maar ze zijn pas ongeveer een jaar oud.”
Replit leert van zijn eigen blunder eerder dit jaar, toen zijn AI-codeur werd gewist de gehele codebasis van een bedrijf in een proefrit. Masad gaf toe: “De gereedschappen waren nog niet volwassen genoeg”, en merkte op dat het bedrijf sindsdien de ontwikkeling heeft geïsoleerd van de productie.
Technieken zoals ‘testen-in-the-loop’, verifieerbare uitvoering en ontwikkelingsisolatie zijn essentieel, merkte hij op, ook al kunnen ze zeer veel middelen vergen. Replit heeft in-the-loop-mogelijkheden opgenomen in versie 3 van zijn agent, en Masad zei dat zijn agent van de volgende generatie 200 minuten autonoom kan werken; sommigen hebben er 20 uur mee gelopen.
Toch erkende hij dat gebruikers frustratie hebben geuit over vertragingstijden. Als ze een ‘flinke prompt’ invoeren, moeten ze mogelijk 20 minuten of langer wachten. Idealiter hebben ze aangegeven dat ze betrokken willen zijn bij een meer creatieve lus waarin ze talloze aanwijzingen kunnen invoeren, aan meerdere taken tegelijk kunnen werken en het ontwerp kunnen aanpassen terwijl de agent aan het werk is.
“De manier om dat op te lossen is parallellisme, door meerdere agentlussen te creëren en ze aan deze onafhankelijke functies te laten werken, terwijl je tegelijkertijd het creatieve werk kunt doen”, zei hij.
Agenten hebben een cultuuromslag nodig
Naast het technische perspectief is er nog een cultureel obstakel: agenten opereren probabilistisch, maar traditionele ondernemingen zijn gestructureerd rond deterministische processen, zegt Mike Clark, directeur productontwikkeling bij Google Cloud. Dit creëert een culturele en operationele mismatch terwijl LLM’s binnenstromen met geheel nieuwe tools, orkestratiekaders en processen.
‘We weten niet hoe we over agenten moeten denken,’ zei Clark. “We weten niet hoe we moeten oplossen wat agenten kunnen doen.”
De bedrijven die het goed doen, worden gedreven door bottom-up-processen, merkte hij op: het creëren van no-code en low-code software en tools in de loopgraven die doorstromen naar grotere agenten. Tot nu toe zijn de succesvolle implementaties beperkt, zorgvuldig van opzet en onder streng toezicht.
“Als ik naar 2025 kijk en naar de belofte dat dit het jaar van de agenten zal zijn, dan was dit het jaar waarin veel mensen bezig waren met het bouwen van prototypes”, aldus Clark. “Nu zitten we midden in deze grootschalige fase.”
Hoe zorg je voor een wereld zonder weilanden?
Een andere strijd is de beveiliging van AI-agenten, die ook een heroverweging van traditionele processen vereist, merkte Clark op.
Er zijn overal veiligheidsgrenzen getrokken, maar dat werkt niet als agenten toegang moeten hebben tot veel verschillende bronnen om de beste beslissingen te kunnen nemen, zegt Clark.
“Het verandert echt onze beveiligingsmodellen, ons basisniveau”, zei hij. “Wat betekent de minste privileges in een weerloze wereld zonder weilanden?”
Uiteindelijk moet er een heroverweging komen van het bestuur door de hele sector, en moeten bedrijven zich aansluiten bij een dreigingsmodel rond agenten.
Clark wees op de ongelijkheid: “Als je naar sommige van je bestuursprocessen kijkt, zul je zeer verrast zijn dat de oorsprong van die processen iemand op een elektrische IBM-typemachine was die in drievoud typte en dat aan drie mensen overhandigde. Dat is niet de wereld waarin we vandaag leven.”


