Home Nieuws Waarom de meeste pilots voor AI-codering op ondernemingsniveau ondermaats presteren (Hint: dit...

Waarom de meeste pilots voor AI-codering op ondernemingsniveau ondermaats presteren (Hint: dit is niet het model)

5
0
Waarom de meeste pilots voor AI-codering op ondernemingsniveau ondermaats presteren (Hint: dit is niet het model)

Gen AI in software-engineering is veel verder gegaan dan alleen automatisch aanvullen. De opkomende grens is agentische codering: AI-systemen die veranderingen kunnen plannen, deze in meerdere stappen kunnen uitvoeren en kunnen herhalen op basis van feedback. Maar ondanks de opwinding rond ‘AI-agents die coderen’ presteren de meeste bedrijfsimplementaties ondermaats. De beperkende factor is niet langer het model. Zijn context: De structuur, geschiedenis en intentie rond de code die wordt gewijzigd. Met andere woorden, bedrijven worden nu geconfronteerd met een systeemontwerpprobleem: ze hebben de omgeving waarin deze agenten opereren nog niet ontwikkeld.

De verschuiving van hulpverlening naar agency

Het afgelopen jaar heeft er een snelle evolutie plaatsgevonden van ondersteunende codeertools naar agentische workflows. Onderzoek begint te formaliseren wat agentisch gedrag in de praktijk betekent: het vermogen om te redeneren over ontwerp, testen, uitvoering en validatie in plaats van geïsoleerde fragmenten te genereren. Werk zoals dynamische actie herbemonstering laat zien dat het toestaan ​​van agenten om hun eigen beslissingen te vertakken, te heroverwegen en te herzien de resultaten in grote, onderling afhankelijke codebases aanzienlijk verbetert. Op platformniveau bouwen providers zoals GitHub nu speciale agent-orkestratieomgevingen, zoals Copilootagent en agenthoofdkwartierom samenwerking tussen meerdere agenten binnen echte ondernemingspijplijnen te ondersteunen.

Maar vroege veldresultaten vertellen een waarschuwend verhaal. Wanneer organisaties agentische tools introduceren zonder aandacht te besteden aan de workflow en de omgeving, kan de productiviteit afnemen. Uit een gerandomiseerde controlestudie van dit jaar bleek dat ontwikkelaars die AI-ondersteuning gebruikten in ongewijzigde workflows taken langzamer voltooiden, grotendeels als gevolg van verificatie, herbewerking en verwarring rond de intentie. De les is duidelijk: autonomie zonder orkestratie levert zelden efficiëntie op.

Waarom context-engineering de echte ontsluiting is

Bij elke mislukte implementatie die ik heb waargenomen, kwam de mislukking voort uit de context. Wanneer agenten geen gestructureerd begrip hebben van een codebase, met name de relevante modules, afhankelijkheidsgrafiek, testharnas, architecturale conventies en veranderingsgeschiedenis. Ze genereren vaak output die correct lijkt, maar losstaat van de realiteit. Te veel informatie overweldigt de agent; te weinig dwingt het om te raden. Het doel is niet om het model meer tokens te geven. Het doel is om te bepalen wat zichtbaar moet zijn voor de agent, wanneer en in welke vorm.

De teams die betekenisvolle winsten zien, beschouwen de context als een technisch oppervlak. Ze creëren tools om snapshots te maken, te comprimeren en versies te maken van de werkgeheugen van de agent: Wat blijft behouden in de beurten, wat wordt weggegooid, wat wordt samengevat en wat is gekoppeld in plaats van inline. Ze ontwerpen overlegstappen in plaats van sessies uit te lokken. Ze maken de specificatie tot een eersteklas artefact, iets dat kan worden beoordeeld, getest en eigendom is, en niet een voorbijgaande chatgeschiedenis. Deze verschuiving sluit aan bij een bredere trend die sommige onderzoekers omschrijven als ‘specificaties die de nieuwe bron van waarheid worden’.

De workflow moet samen met de tooling veranderen

Maar context alleen is niet genoeg. Bedrijven moeten de workflows rond deze agenten opnieuw ontwerpen. Als McKinsey’s rapport uit 2025 “Eén jaar Agentic AI” Zoals opgemerkt, komt productiviteitswinst niet voort uit het in lagen aanbrengen van AI op bestaande processen, maar uit het heroverwegen van het proces zelf. Wanneer teams simpelweg een agent in een ongewijzigde workflow laten vallen, ontstaat er wrijving: ingenieurs besteden meer tijd aan het verifiëren van door AI geschreven code dan ze zelf zouden hebben besteed aan het schrijven ervan. De agenten kunnen alleen versterken wat al gestructureerd is: goed geteste, modulaire codebases met duidelijk eigendom en documentatie. Zonder deze fundamenten wordt autonomie een chaos.

Ook veiligheid en bestuur vereisen een mentaliteitsverandering. Door AI gegenereerde code introduceert nieuwe vormen van risico: niet-doorgelichte afhankelijkheden, subtiele licentieschendingen en ongedocumenteerde modules die aan peer review ontsnappen. Volwassen teams beginnen de activiteit van agenten rechtstreeks in hun team te integreren CI/CD-pijplijnenwaarbij agenten worden behandeld als autonome bijdragers wier werk dezelfde statische analyse, auditregistratie en goedkeuringspoorten moet doorstaan ​​als elke menselijke ontwikkelaar. De eigen documentatie van GitHub benadrukt dit traject, waarbij Copilot Agents niet worden gepositioneerd als vervanging voor engineers, maar als georkestreerde deelnemers aan veilige, controleerbare workflows. Het doel is niet om een ​​AI ‘alles te laten schrijven’, maar om ervoor te zorgen dat wanneer hij handelt, hij dit binnen bepaalde vangrails doet.

Waar zakelijke besluitvormers zich nu op moeten concentreren

Voor technische leiders begint de weg voorwaarts met paraatheid in plaats van met een hype. Monolieten met schaarse tests leveren zelden nettowinst op; Agents gedijen goed waar tests gezaghebbend zijn en iteratieve verfijning kunnen stimuleren. Dit is precies de lus Antropisch roept om codeeragenten. Pilots in strak afgebakende domeinen (testgeneratie, modernisering van legacy, geïsoleerde refactoren); behandel elke implementatie als een experiment met expliciete meetgegevens (ontsnappingspercentage van defecten, PR-cyclustijd, percentage mislukte wijzigingen, beveiligingsbevindingen opgebrand). Naarmate uw gebruik groeit, kunt u agents behandelen als een data-infrastructuur: elk plan, context-snapshot, actielogboek en testrun zijn gegevens die samenkomen in een doorzoekbaar geheugen van technische bedoelingen en een duurzaam concurrentievoordeel.

Onder de motorkap is agentische codering niet zozeer een gereedschapsprobleem als wel een dataprobleem. Elke contextsnapshot, testiteratie en coderevisie wordt een vorm van gestructureerde gegevens die moeten worden opgeslagen, geïndexeerd en hergebruikt. Naarmate deze agenten zich uitbreiden, zullen bedrijven merken dat ze een geheel nieuwe datalaag moeten beheren: een laag die niet alleen vastlegt wat er is gebouwd, maar ook hoe daarover werd geredeneerd. Deze verschuiving verandert technische logboeken in een kennisgrafiek van intentie, besluitvorming en validatie. Op termijn zullen de organisaties die dit contextuele geheugen kunnen doorzoeken en afspelen de organisaties die code nog steeds als statische tekst behandelen, voorbijstreven.

Het komende jaar zal waarschijnlijk bepalen of agentische codering een hoeksteen van de bedrijfsontwikkeling wordt of een andere opgeblazen belofte. Het verschil zal afhangen van context-engineering: hoe intelligent teams het informatiesubstraat ontwerpen waarop hun agenten vertrouwen. De winnaars zullen degenen zijn die autonomie niet als magie zien, maar als een verlengstuk van gedisciplineerd systeemontwerp: duidelijke workflows, meetbare feedback en rigoureus bestuur.

Kortom

Platformen convergeren op het gebied van orkestratie en vangrails, en onderzoek blijft de contextcontrole op het moment van inferentie verbeteren. De winnaars van de komende 12 tot 24 maanden zullen niet de teams met het meest opvallende model zijn; zij zullen degenen zijn die de context als een pluspunt beschouwen en de workflow als het product behandelen. Doe dat, en de autonomie wordt groter. Sla het over en de beoordelingswachtrij doet dat ook.

Context + agent = hefboomwerking. Sla de eerste helft over en de rest stort in.

Dhyey Mavani versnelt generatieve AI op LinkedIn.

Lees meer van onze gastschrijvers. Of overweeg om zelf een bericht te plaatsen! Zie onze richtlijnen hier.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in