Home Nieuws Agentische codering op bedrijfsschaal vereist spec-gedreven ontwikkeling

Agentische codering op bedrijfsschaal vereist spec-gedreven ontwikkeling

6
0
Agentische codering op bedrijfsschaal vereist spec-gedreven ontwikkeling

Gepresenteerd door AWS


Autonome agenten comprimeren de leveringstijdlijnen van software van weken tot dagen. De ondernemingen die agents veilig kunnen opschalen, zullen degenen zijn die bouwen met behulp van spec-driven development.

Er is een moment in elke technologische verschuiving waarop de early adopters niet langer uitschieters zijn, maar de basislijn gaan vormen. We bevinden ons op dat moment in de softwareontwikkeling en de meeste teams beseffen het nog niet.

Een jaar geleden ging vibe-codering viraal. Niet-ontwikkelaars en junior-ontwikkelaars ontdekten dat ze met AI verder konden bouwen dan ze konden. Het verlaagde de vloer. Het maakte het maken van prototypen veel sneller, maar het introduceerde ook een overschot aan slop. Wat de industrie toen nodig had, was iets dat het plafond verhoogde; iets dat de kwaliteit van de code verbeterde en werkte zoals de meest deskundige ontwikkelaars werken. Spec-gedreven ontwikkeling deed dat. Het legde de basis voor betrouwbare autonome codeermiddelen.

Specificaties zijn het vertrouwensmodel voor autonome ontwikkeling

De meeste discussies over door AI gegenereerde code richten zich op de vraag of AI code kan schrijven. De moeilijkere vraag is of je erop kunt vertrouwen. Het antwoord loopt rechtstreeks via de specificatie.

Spec-gedreven ontwikkeling begint met een bedrieglijk eenvoudig idee: voordat een AI-agent ook maar één regel code schrijft, werkt deze vanuit een gestructureerde, contextrijke specificatie die definieert wat het systeem moet doen, wat de eigenschappen ervan zijn en wat ‘correct’ eigenlijk betekent. Die specificatie is een artefact waar de agent gedurende het hele ontwikkelingsproces tegen redeneert – fundamenteel verschillend van pre-agentische AI-benaderingen van het achteraf schrijven van documentatie.

Enterprise-teams bouwen voort op deze basis. Het Kiro IDE-team gebruikte Kiro om Kiro IDE te bouwen – een agentische codeeromgeving met native spec-gestuurde ontwikkeling – waardoor het bouwen van functies werd teruggebracht van twee weken naar twee dagen. Een AWS-engineeringteam voltooide een 18 maanden durend herarchitectuurproject, oorspronkelijk bedoeld voor 30 ontwikkelaars, waarbij zes mensen in 76 dagen Kiro gebruikten. Een technisch team van Amazon.com heeft “Add to Delivery” geïntroduceerd – een functie waarmee shoppers items kunnen toevoegen na het afrekenen – twee maanden eerder dan gepland door gebruik te maken van Kiro en spec-driven development. Alexa+, Amazon Finance, Amazon Stores, AWS, Fire TV, Last Mile Delivery, Prime Video en meer integreren allemaal spec-gestuurde ontwikkeling als onderdeel van hun bouwaanpak.

Die verschuiving verandert alles stroomafwaarts.

Verifieerbare tests zorgen ervoor dat autonome agenten veilig kunnen worden uitgevoerd

De specificatie wordt een geautomatiseerde correctheidsengine. Wanneer een ontwikkelaar met behulp van AI 150 check-ins per week genereert, kan geen mens dat codevolume handmatig beoordelen. In plaats daarvan kan code die op basis van een concrete specificatie is gebouwd, worden geverifieerd door middel van op eigenschappen gebaseerde tests en neurosymbolische AI-technieken die automatisch honderden testgevallen genereren die rechtstreeks uit de specificatie zijn afgeleid, waarbij randgevallen worden onderzocht die geen mens zou denken met de hand te schrijven. Deze tests bewijzen dat de code voldoet aan de gedefinieerde eigenschappen van de specificatie en gaan veel verder dan handgeschreven testsuites wat betreft aantoonbaar correct gedrag.

Verifieerbaar testen maakt de verschuiving mogelijk van eenmalige programmering naar continue autonome ontwikkeling. Traditionele, door AI ondersteunde ontwikkeling werkt in één keer: u geeft de agent een specificatie, de agent produceert output en het proces eindigt. De agenten van vandaag corrigeren zichzelf voortdurend, voeden bouw- en testfouten terug in hun eigen redenering, genereren aanvullende tests om hun eigen output te onderzoeken en itereren totdat ze iets produceren dat zowel functioneel als verifieerbaar is. De specificatie is het anker dat ervoor zorgt dat de lus niet afdrijft. In plaats van dat ontwikkelaars voortdurend controleren of de agent de juiste beslissingen neemt, kan de agent zichzelf aan de hand van de specificaties controleren om er zeker van te zijn dat hij op de goede weg is.

De autonome agent van de toekomst zal zijn eigen specificaties schrijven, waarbij hij specificaties gebruikt als mechanisme voor zelfcorrectie, voor verificatie, om ervoor te zorgen dat wat hij produceert overeenkomt met het beoogde gedrag van het systeem.

Multi-agent, autonoom en direct actief

De ontwikkelaars die vandaag de dag het tempo bepalen, opereren op een fundamenteel andere manier. Ontwikkelaars besteden veel tijd aan het bouwen van hun specificaties, maar ook aan het schrijven van stuurbestanden die door de specificaties worden gebruikt om ervoor te zorgen dat de agent weet wat en hoe hij moet bouwen – meer tijd dan hun agent misschien besteedt aan het bouwen van de daadwerkelijke software. Ze voeren meerdere agenten parallel uit om een ​​probleem vanuit verschillende perspectieven te bekritiseren, en voeren ook meerdere specificaties uit, elk geschreven voor een ander onderdeel van het systeem dat ze bouwen. Ze lieten agenten uren, soms dagen rennen. Ze gebruiken duizenden Kiro-credits omdat de output dit rechtvaardigt.

Een jaar geleden verloren agenten hun context en vielen ze na twintig minuten uit elkaar. Nu kun je ze elke week langer laten draaien dan de week ervoor. De capaciteiten van agenten zijn de afgelopen zes maanden aanzienlijk verbeterd, zodat werkelijk complexe problemen behandelbaar zijn. Nieuwere LLM’s zijn token-efficiënter dan de vorige generatie, dus voor dezelfde uitgaven krijgt u aanzienlijk meer gedaan.

De uitdaging is dat om dit goed te doen diepgaande expertise vereist is. De tools, methodologieën en infrastructuur bestaan, maar het orkestreren ervan is moeilijk. Het doel van Kiro is om deze mogelijkheden met diepgaande expertise aan elke ontwikkelaar te bieden, en niet alleen aan de top één procent die het al heeft ontdekt.

Infrastructuur haalt de ambitie in

Agenten zullen binnen een jaar tien keer zo capabel zijn. Dat is het tempo van verbetering dat we week na week zien.

Tegelijkertijd convergeert de infrastructuur die dat vaardigheidsniveau ondersteunt. Agents draaien nu in de cloud in plaats van lokaal, en worden parallel op schaal uitgevoerd met veilige, betrouwbare communicatie tussen agentsystemen. Organisaties kunnen nu agentische workloads uitvoeren op dezelfde manier als elk gedistribueerd systeem op bedrijfsniveau, met beheer, kostenbeheersing en betrouwbaarheidsgaranties die serieuze software vereist. Spec-gedreven ontwikkeling is de architectuur van de autonome systemen van morgen.

Ontwikkelaars worden niet langer beperkt door de manier waarop ze het probleem willen oplossen. De ontwikkelaars die het goed doen in deze wereld zijn degenen die nu die basis leggen: gebruik maken van spec-gedreven ontwikkeling, vanaf het begin prioriteit geven aan testbaarheid en verificatie, samenwerken met agenten en denken in systemen in plaats van syntaxis.

Deepak Singh is vice-president van Kiro bij AWS.


Gesponsorde artikelen zijn inhoud die is geproduceerd door een bedrijf dat voor de post betaalt of een zakelijke relatie heeft met VentureBeat, en deze is altijd duidelijk gemarkeerd. Voor meer informatie kunt u contact opnemen met sales@venturebeat.com.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in