AI codeeragenten zijn een van de snelstgroeiende categorieën in bedrijfssoftware geworden. In slechts een paar jaar tijd zijn deze ontwikkelingshulpmiddelen geëvolueerd van eenvoudige autocomplete-assistenten naar autonome systemen die in staat zijn de volledige softwareontwikkelingscyclus over te nemen, allemaal via natuurlijke taalprompts.
Nu vibe-coding een vlucht neemt, hebben tools van startups als Cursor en Claude Code van Anthropic snel omzetcijfers van miljarden dollars bereikt. Cursor zou in 2025 naar verluidt de $1 miljard aan jaarlijks terugkerende inkomsten (ARR) hebben overschreden en heeft sindsdien de $2 miljard in het eerste kwartaal van 2026 benaderd. Claude Code van Anthropic is nog sneller opgeschaald en bereikte in het eerste jaar een geschatte jaarlijkse run rate van $2,5 miljard, waardoor het een van de snelst groeiende producten is in de categorie die verantwoordelijk is voor een groot deel van Anthropic’s ARR van $14 miljard.
Toch is het schrijven van code binnen grote ondernemingen zelden het moeilijkste deel van het werk. Datawetenschappers, ingenieurs en analisten besteden een groot deel van hun tijd aan het onderhouden en uitbreiden van pijpleidingen in plaats van aan het bouwen van nieuwe. Het echte knelpunt bij enterprise AI is daarom niet de softwareontwikkeling zelf, maar het exploiteren van complexe datasystemen in de productie.
CEO en mede-oprichter van Databricks, Ali Ghodsi, is van mening dat deze kloof de volgende grens voor AI-automatisering vertegenwoordigt. Volgens hem zal de volgende generatie AI-agenten niet alleen software schrijven, maar ook de datasystemen beheren waarvan moderne bedrijven afhankelijk zijn.
Die strategische gok ligt achter Genie Code, een systeem van autonome AI-agenten dat vandaag is onthuld en is ontworpen voor data-engineering, datawetenschap en analyseactiviteiten. Het systeem breidt het bestaande Genie-platform-ecosysteem van het bedrijf uit, waardoor kenniswerkers in natuurlijke taal vragen kunnen stellen over bedrijfsgegevens. (Meer dan 20.000 organisaties maakten al gebruik van Databricks tools voor gegevensbeheer en analyse; De ARR van het bedrijf overtrof in februari de jaaromzet van $ 5,4 miljard.)
“In plaats van alleen maar als codeerassistent te functioneren of te helpen sneller code te genereren, begrijpen deze agenten daadwerkelijk de structuur van de gegevens en bestaande gegevensproblemen”, zegt Ali Ghodsi. “Het kan automatisch pijplijnen opzetten, analyseren waarom iets faalt en inzicht krijgen in problemen zoals wanneer een datasetschema verandert of wanneer machtigingen worden gewijzigd.”
Genie Code kan bijvoorbeeld helpen bepalen hoe een dataset moet worden voorbereid op modellering: het willekeurig maken van de gegevens, het scheiden van een deel ervan in een testset of het trainen van een model op het resterende deel. Na de training kan het systeem helpen bij het evalueren van de resultaten met behulp van meetgegevens zoals F1-scores of het gebied onder de curve, en deze vervolgens analyseren om te bepalen of het model goed presteert of verbetering behoeft.
“Het kan voorstellen om verschillende benaderingen uit te proberen – misschien het model opnieuw te trainen of plots en grafieken te genereren om de prestaties te visualiseren, en redeneringen bloot te leggen over welke veranderingen de resultaten zouden kunnen verbeteren”, legt Ghodsi uit. “Het gaat niet alleen om het genereren van willekeurige codefragmenten, maar om het begrijpen van de hele structuur van het dataprobleem en het doorlopen van de modelleringsworkflow op dezelfde manier als een datawetenschapper of ingenieur dat zou doen.”
Databricks en ondernemingscontext
Een belangrijke reden waarom veel AI-codeeragenten het moeilijk hebben in bedrijfsdataomgevingen is de context. De meeste ontwikkelaarstools trainen voornamelijk op openbare codeopslagplaatsen en algemene programmeervoorbeelden. Enterprise-datasystemen voegen echter nog een extra laag complexiteit toe. Data dragen zakelijke semantiek, governanceregels en toegangsbeleid met zich mee die bepalen hoe informatie kan worden gebruikt. Zonder die context kan een AI-agent technisch correcte code genereren die faalt zodra deze in productie wordt ingezet.
Genie Code probeert dat probleem aan te pakken door rechtstreeks te integreren met Unity Catalog, het governanceframework van Databricks voor bedrijfsgegevens. Dankzij deze integratie kan het systeem de dataafkomst, toegangsrechten en organisatiebeleid binnen het gehele datadomein van een onderneming begrijpen.
“Het onderhouden van pijpleidingen en ervoor zorgen dat ze betrouwbaar zijn en altijd actief zijn, is een groot deel van het werk van een data-ingenieur, en dit is waar Genie Code deze aanzienlijk kan uitbreiden”, zegt Ghodsi. “Het kan systemen continu monitoren en onmiddellijk reageren als er iets kapot gaat, zelfs midden in de nacht, door complexe sporen te analyseren en een diagnose te stellen van wat er is gebeurd, zodat de pijpleiding kan worden gerepareerd en betrouwbaar kan blijven draaien.”
De architectuur is gebaseerd op een multi-agentarchitectuur die wordt aangedreven door meerdere AI-modellen. Ghodsi legt uit dat het systeem LLM’s combineert van providers als Anthropic, OpenAI en Google, naast kleinere open-sourcemodellen die zijn geoptimaliseerd voor specifieke taken. “Er zijn veel dingen in een workflow waarbij je geen enorm model nodig hebt; je hebt alleen iets snels nodig dat een heel specifieke bewerking betrouwbaar kan uitvoeren.”
De grotere modellen bieden de redeneermogelijkheden die nodig zijn voor het oplossen en plannen van complexe problemen. Kleinere open-sourcemodellen zijn getraind om meer routinematige handelingen snel en efficiënt uit te voeren. Bovendien is de architectuur opgebouwd rond meerdere samenwerkende agenten in plaats van één enkel monolithisch AI-systeem. Elke agent is gespecialiseerd in bepaalde functies, zoals het diagnosticeren van pijpleidingstoringen of het analyseren van gegevenspatronen. Deze agenten delen context, geheugen en vaardigheden, waardoor ze hun acties kunnen coördineren en complexe workflows over de hele gegevensstapel kunnen uitvoeren.
Databricks beschrijft deze aanpak als ‘agentisch datawerk’. In plaats van een AI-assistent om kleine stukjes code te vragen, kunnen gebruikers hele doelstellingen aan het systeem delegeren.
Een andere uitdaging met autonome AI-systemen is het handhaven van betrouwbare prestaties in productieomgevingen in de loop van de tijd, omdat agenten vaak onbekende scenario’s tegenkomen die de prestaties verslechteren. Om dat probleem aan te pakken heeft Databricks Quotient AI overgenomen, een startup die gespecialiseerd is in evaluatie- en versterkingsleren voor AI-agenten. De technologie van het bedrijf helpt bij het evalueren van het gedrag van agenten, het continu meten van de uitvoerkwaliteit en het detecteren van achteruitgang voordat deze productiefouten veroorzaken. De oprichters van Quotient AI werkten eerder aan het verbeteren van de kwaliteit van GitHub Copilot, waardoor ze diepgaande expertise kregen in het evalueren van AI-coderingssystemen.
Vibe-codering voor datasystemen
De opkomst van vibe-coding heeft een nieuw slagveld gecreëerd voor agentische AI-aangedreven codeertools en het concurrentielandschap in de software-infrastructuur opnieuw vormgegeven. Databricks benadert de markt vanuit een andere richting. Ghodsi zegt dat de markt voor AI-codering en de markt voor bedrijfsdata-automatisering zich in parallelle maar verschillende richtingen ontwikkelen.
Terwijl tools als Cursor en de codeeragenten van Anthropic de manier waarop ontwikkelaars software schrijven hervormen, richt Databricks zich op het transformeren van de manier waarop bedrijven hun datasystemen beheren en exploiteren. “Ook al bevat onze productnaam ‘code’, de nadruk ligt eigenlijk op datawerk”, zegt Ghodsi.
Genie Code richt zich op de workflows die plaatsvinden nadat gegevens het platform van een organisatie binnenkomen. Door zich te concentreren op de gegevenslaag wil het bedrijf problemen aanpakken waarvoor codeerassistenten voor algemene doeleinden niet zijn ontworpen. “De andere tools op de markt helpen software-ingenieurs bij het schrijven van applicatiecode, wat geweldig is”, zegt Ghodsi, “maar voor ons is het einddoel de data: data op betrouwbare wijze transformeren en organisaties helpen met hun data te werken.”
Verschillende organisaties, waaronder SiriusXM en Repsol, zijn al begonnen met experimenteren met de technologie. SiriusXM gebruikt Genie Code om interne dataproducten te bouwen en te onderhouden, SQL-query’s te genereren en pijplijnen te debuggen. Volgens Ghodsi heeft het bedrijf ongeveer 20% gerapporteerd productiviteit verbeteringen in data-engineeringtaken. Genie Code helpt ingenieurs bij het creëren van dataproducten met gedefinieerde service-level-overeenkomsten en betrouwbaarheidsgaranties.
Op dezelfde manier gebruikt het multinationale energie- en petrochemische bedrijf Repsol de technologie om prognoses en productieworkflows te versnellen. In plaats van notebooks, pijplijnen en modellen tussen verschillende systemen handmatig met elkaar te verbinden, kunnen ingenieurs erop vertrouwen dat Genie Code deze processen automatisch orkestreert. Ghodsi voegde eraan toe dat duizenden andere klanten al met de technologie experimenteren, hoewel veel implementaties zich nog in de beginfase bevinden.
De toekomst van menselijke techniek
Ghodsi verwacht niet dat autonome agenten menselijke ingenieurs zullen vervangen. In plaats daarvan besteden ingenieurs mogelijk minder tijd aan het schrijven van code en meer tijd aan het ontwerpen van architecturen, het toezicht houden op geautomatiseerde systemen en het garanderen dat AI-gestuurde workflows betrouwbaar werken.
“De kosten van automatisering dalen en de tools worden gemakkelijker te gebruiken, dus de vraag naar automatisering neemt uiteraard toe. Als je al naar enkele cijfers kijkt, bestaat een groot percentage van de activiteit op machines uit agenten die op de achtergrond opereren”, zegt hij.
Volgens het bedrijf is onlangs vrijgegeven Staat van AI-agenten Volgens het rapport creëren AI-agenten nu 80% van de databases en 97% van de test- en ontwikkelomgevingen op het Databricks-platform. Nog maar twee jaar geleden registreerden agenten nauwelijks databaseactiviteiten, terwijl menselijke ontwikkelaars bijna al dat werk voor hun rekening namen.
“Het zou mij niet verbazen als dat aantal in korte tijd van 80% naar 99% gaat. Maar dat betekent niet dat mensen uit het proces verdwijnen”, legt Ghodsi uit. “Je moet ook nadenken over juridische verantwoordelijkheid en kwaliteitsgaranties. Dat zijn gebieden waar je nog steeds een mens in de loop nodig hebt.”


