Het tijdperk waarin bedrijven promptketens en schaduwagenten aan elkaar hechten, nadert zijn einde naarmate er meer opties ontstaan voor het orkestreren van complexe multi-agentsystemen. Terwijl organisaties AI-agenten in productie brengen, blijft de vraag: “hoe gaan we ze beheren?”
Google en Amazon Web Services bieden fundamenteel verschillende antwoorden, wat een splitsing in de AI-stack illustreert. De aanpak van Google is om agentisch beheer op de systeemlaag uit te voeren, terwijl de harnasmethode van AWS wordt ingesteld in de uitvoeringslaag.
Het debat over hoe te beheren en te controleren kreeg de afgelopen maand nieuwe energie toen concurrerende bedrijven hun agentbuilderplatforms – Anthropic met de nieuwe Claude Managed Agents en OpenAI met verbeteringen aan de Agents-SDK— ontwikkelaarsteams opties geven voor het beheren van agenten.
AWS waaraan nieuwe mogelijkheden zijn toegevoegd Bedrock AgentCore optimaliseert voor snelheid – vertrouwt op harnassen om agenten sneller naar het product te brengen – terwijl het nog steeds identiteits- en toolbeheer biedt.
In de tussentijd, Google’s Gemini Enterprise hanteert een op governance gerichte aanpak met behulp van een controlevlak in Kubernetes-stijl. Elke methode biedt een kijkje in de manier waarop agenten binnen een workflow van korte taakhulpen naar langer lopende entiteiten gaan.
Upgrades en paraplu’s
Om te begrijpen waar elk bedrijf staat, volgt hier wat er feitelijk nieuw is.
Google heeft een nieuwe versie van Gemini Enterprise uitgebracht, waarmee het aanbod van zakelijke AI-agenten – Gemini Enterprise Platform en Gemini Enterprise Application – onder één paraplu wordt gebracht.
Het bedrijf heeft een nieuwe naam gekregen Vertex AI als Gemini Enterprise-platformhoewel het benadrukt dat het, afgezien van de naamswijziging en nieuwe functies, in wezen nog steeds dezelfde interface is.
“We willen een platform en een voordeur bieden waarmee bedrijven toegang kunnen krijgen tot alle AI-systemen en tools die Google biedt”, vertelde Maryam Gholami, senior director productmanagement bij Gemini Enterprise, in een interview aan VentureBeat. “Je kunt erover nadenken dat de Gemini Enterprise Application bovenop het Gemini Enterprise Agent Platform is gebouwd, en dat de beveiligings- en beheertools allemaal gratis worden aangeboden als onderdeel van het Gemini Enterprise Application-abonnement.”
Anderzijds, AWS heeft een nieuw beheerd agentharnas toegevoegd aan Bedrock Agentcore. Het bedrijf zei in een persbericht gedeeld met VentureBeat dat het harnas “de voorafgaande build vervangt door een op configuratie gebaseerd startpunt, mogelijk gemaakt door Strands Agents, het open source agentframework van AWS.”
Gebruikers definiëren wat de agent doet, welk model hij gebruikt en welke tools hij aanroept, en AgentCore doet het werk om dat allemaal samen te voegen om de agent te laten draaien.
Agenten worden nu systemen
De verschuiving naar stateful, langlopende autonome agenten heeft geleid tot een heroverweging van de manier waarop AI-systemen zich gedragen. Terwijl agenten overstappen van kortstondige taken naar langlopende workflows, ontstaat er een nieuwe klasse van mislukkingen: statusafwijking.
Terwijl agenten blijven opereren, accumuleren ze toestanden – ook herinneringen, reacties en evoluerende context. Na verloop van tijd raakt die toestand achterhaald. Gegevensbronnen veranderen, of tools kunnen tegenstrijdige reacties opleveren. Maar de agent wordt kwetsbaarder voor inconsistenties en wordt minder waarheidsgetrouw.
De betrouwbaarheid van agenten wordt een systeemprobleem, en voor het beheersen van die drift is wellicht meer nodig dan een snellere uitvoering; het kan zichtbaarheid en controle vereisen.
Het is dit faalpunt dat platforms als Gemini Enterprise en AgentCore proberen te voorkomen.
Hoewel deze verschuiving al gaande is, gaf Gholami toe dat klanten zullen dicteren hoe ze een langlopende agent willen runnen en controleren.
“We gaan veel leren van klanten waarbij ze langlopende agenten zouden gebruiken, waarbij ze gewoon een taak aan deze autonome agenten zouden toewijzen om gewoon door te gaan en dat te doen”, aldus Gholami. “Natuurlijk zijn er trucjes en evenwichten om de juiste balans te vinden en het kan zijn dat de agent terugkomt en om meer input vraagt.”
De nieuwe AI-stack
Wat steeds duidelijker wordt, is dat de AI-stack zich opsplitst in verschillende lagen, waardoor verschillende problemen worden opgelost.
AWS en, tot op zekere hoogte, Anthropic en OpenAI optimaliseren voor een snellere implementatie. Claude Managed Agents neemt een groot deel van het backend-werk voor het opstaan van een agent weg, terwijl de Agents SDK nu ondersteuning biedt voor sandboxes en een kant-en-klaar harnas. Deze benaderingen zijn bedoeld om de drempel te verlagen om agenten aan de slag te krijgen.
Google biedt een gecentraliseerd controlepaneel om identiteit te beheren, beleid af te dwingen en langdurig gedrag te monitoren.
Bedrijven hebben waarschijnlijk beide nodig.
Zoals sommige praktijkmensen het zien, moeten hun bedrijven een serieus gesprek voeren over hoeveel risico ze bereid zijn te nemen.
“De belangrijkste conclusie voor leiders op het gebied van bedrijfstechnologie die deze technologieën op dit moment overwegen, kan op deze manier worden geformuleerd: hoewel de vraag tussen agenten en runtime vaak wordt gezien als bouwen versus kopen, is dit in de eerste plaats een kwestie van risicobeheer. Als u het zich kunt veroorloven om uw agenten door een runtime van een derde partij te laten lopen omdat deze geen invloed hebben op uw inkomstenstromen, is dat oké. Integendeel, in de context van meer kritische processen zal de laatste optie de enige zijn die vanuit een zakelijk perspectief moet worden overwogen”, zegt Rafael Sarim Oezdemir, hoofd groei. bij EZContacts, vertelde VentureBeat in een e-mail.
Door snel te itereren kunnen teams experimenteren en ontdekken wat agenten kunnen doen, terwijl gecentraliseerde controle een vertrouwenslaag toevoegt. Wat ondernemingen nodig hebben, is ervoor zorgen dat ze niet vastzitten in systemen die uitsluitend zijn ontworpen voor één enkele manier om agenten uit te voeren.


