Home Nieuws Hoe context-engineering uw bedrijf kan redden van een overbelasting van AI-vibecode: lessen...

Hoe context-engineering uw bedrijf kan redden van een overbelasting van AI-vibecode: lessen van Qodo en Monday.com

16
0

Als cloudsoftware voor het volgen van projecten maandag.comToen de technische organisatie de 500 ontwikkelaars overschreed, begon het team de druk van zijn eigen succes te voelen. Productlijnen vermenigvuldigden zich, microservices verspreidden zich en de code stroomde sneller dan menselijke recensenten konden bijhouden. Het bedrijf had een manier nodig om elke maand duizenden pull-aanvragen te beoordelen zonder ontwikkelaars in verveling te verdrinken – of de kwaliteit te laten verslappen.

Dat is het moment waarop Guy Regev, VP R&D en hoofd van de teams Growth en Monday Dev, begon te experimenteren met een nieuwe AI-tool van Graveneen Israëlische startup die zich richt op ontwikkelaarsagenten. Wat begon als een lichtgewicht test werd al snel een cruciaal onderdeel van de softwareleveringsinfrastructuur van monday.com nieuwe casus onthuld door zowel Qodo als monday.com.

“Qodo voelt niet als zomaar een tool – het is als het toevoegen van een nieuwe ontwikkelaar aan het team die daadwerkelijk leert hoe we werken,” vertelde Regev aan VentureBeat in een recent videogesprek, eraan toevoegend dat het “voorkwam dat meer dan 800 problemen per maand in productie kwamen – waarvan sommige ernstige beveiligingsproblemen hadden kunnen veroorzaken.”

In tegenstelling tot tools voor het genereren van code, zoals GitHub Copilot of Cursor, probeert Qodo geen nieuwe code te schrijven. In plaats daarvan is het gespecialiseerd in het beoordelen ervan – met behulp van wat het noemt contexttechniek om niet alleen te begrijpen wat er is veranderd in een pull-verzoek, maar ook waarom, hoe het aansluit bij de bedrijfslogica en of het interne best practices volgt.

“Je kunt Claude Code of Cursor bellen en binnen vijf minuten krijg je 1.000 regels code”, zegt Itamar Friedman, medeoprichter en CEO van Qodo, in hetzelfde videogesprek als met Regev. “Je hebt 40 minuten en je kunt dat niet bekijken. Je hebt dus Qodo nodig om het daadwerkelijk te bekijken.”

Voor monday.com was deze mogelijkheid niet alleen nuttig, maar ook transformatief.

Codebeoordeling, op schaal

Op elk moment verzenden de ontwikkelaars van monday.com updates naar honderden opslagplaatsen en services. De engineeringorganisatie werkt in strak gecoördineerde teams, elk afgestemd op specifieke onderdelen van het product: marketing, CRM, ontwikkeltools, interne platforms en meer.

Dat is waar Qodo in beeld kwam. Het platform van het bedrijf gebruikt AI niet alleen om te controleren op duidelijke bugs of stijlschendingen, maar om te evalueren of een pull-verzoek teamspecifieke conventies, architecturale richtlijnen en historische patronen volgt.

Het doet dit door te leren van uw eigen codebase: training over eerdere PR’s, opmerkingen, samenvoegingen en zelfs Slack-threads om te begrijpen hoe uw team werkt.

“De commentaren die Qodo geeft zijn niet algemeen: ze weerspiegelen onze waarden, onze bibliotheken en zelfs onze normen voor zaken als functievlaggen en privacy”, aldus Regev. “Het is contextbewust op een manier waarop traditionele tools dat niet zijn.”

Wat “Context Engineering” eigenlijk betekent

Qodo noemt zijn geheime saus contexttechniek – een benadering op systeemniveau voor het beheren van alles wat het model ziet bij het nemen van een beslissing.

Dit omvat uiteraard de PR-code diff, maar ook eerdere discussies, documentatie, relevante bestanden uit de repository, zelfs testresultaten en configuratiegegevens.

Het idee is dat taalmodellen niet echt ‘denken’: ze voorspellen het volgende token op basis van de input die ze krijgen. De kwaliteit van hun output hangt dus vrijwel volledig af van de kwaliteit en structuur van hun input.

Zoals Dana Fine, de communitymanager van Qodo, het in een blogpost: “Je schrijft niet alleen maar aanwijzingen; je ontwerpt gestructureerde invoer onder een vaste tokenlimiet. Elke token is een ontwerpbeslissing.”

Dit is niet alleen maar theorie. In het geval van monday.com betekende dit dat Qodo niet alleen de voor de hand liggende bugs kon opsporen, maar ook de subtiele bugs die doorgaans aan menselijke reviewers voorbijglippen: hardgecodeerde variabelen, ontbrekende fallbacks of schendingen van architectuurconventies tussen teams.

Eén voorbeeld viel op. In een recente PR heeft Qodo een regel gemarkeerd die onbedoeld een staging-omgevingsvariabele blootlegde – iets wat geen enkele menselijke recensent heeft opgemerkt. Als het was samengevoegd, had dit mogelijk problemen in de productie kunnen veroorzaken.

“De uren die we zouden besteden aan het oplossen van dit beveiligingslek en de juridische problemen die het met zich mee zou brengen, zouden veel meer zijn dan de uren die we zouden besparen na een pull-request”, aldus Regev.

Integratie in de pijplijn

Tegenwoordig is Qodo diep geïntegreerd in de ontwikkelingsworkflow van monday.com, waarbij pull-aanvragen worden geanalyseerd en contextbewuste aanbevelingen worden gedaan op basis van eerdere teamcodebeoordelingen.

“Het voelt niet als zomaar een tool… Het voelt als een nieuwe teamgenoot die zich bij het systeem heeft aangesloten – iemand die leert hoe we werken”, merkte Regev op.

Ontwikkelaars ontvangen suggesties tijdens het beoordelingsproces en behouden de controle over de uiteindelijke beslissingen – een ‘human-in-the-loop’-model dat van cruciaal belang was voor adoptie.

Omdat Qodo rechtstreeks in GitHub integreerde via pull-request-acties en opmerkingen, had het infrastructuurteam van Monday.com geen steile leercurve.

“Het is gewoon een GitHub-actie”, zei Regev. “Het creëert een PR met de tests. Het is niet een aparte tool die we moesten leren.”

“Het doel is om de ontwikkelaar daadwerkelijk te helpen de code te leren, eigenaarschap te nemen, elkaar feedback te geven, daarvan te leren en de normen vast te stellen”, aldus Friedman.

De resultaten: tijdsbesparing, bugs voorkomen

Sinds Qodo breder is uitgerold, heeft monday.com meetbare verbeteringen gezien bij meerdere teams.

Uit interne analyses blijkt dat ontwikkelaars gemiddeld ongeveer een uur per pull-request besparen. Vermenigvuldig dat met duizenden PR’s per maand, en de besparingen bereiken al snel duizenden ontwikkelaarsuren per jaar.

Dit zijn niet alleen cosmetische problemen; veel daarvan hebben te maken met bedrijfslogica, beveiliging of runtime-stabiliteit. En omdat de suggesties van Qodo de feitelijke conventies van monday.com weerspiegelen, is de kans groter dat ontwikkelaars ernaar handelen.

De nauwkeurigheid van het systeem is geworteld in het data-first-ontwerp. Qodo traint op de privécodebase en historische gegevens van elk bedrijf en past zich aan verschillende teamstijlen en -praktijken aan. Het is niet afhankelijk van one-size-fits-all regels of externe datasets. Alles is op maat.

Van interne tool tot productvisie

Het team van Regev was zo onder de indruk van de impact van Qodo dat ze diepere integraties zijn gaan plannen tussen Qodo en Monday Dev, de op ontwikkelaars gerichte productlijn die monday.com aan het bouwen is.

De visie is om een ​​workflow te creëren waarin de zakelijke context – taken, tickets, feedback van klanten – rechtstreeks naar de codebeoordelingslaag stroomt. Op die manier kunnen reviewers niet alleen beoordelen of de code ‘werkt’, maar ook of deze het juiste probleem oplost.

“Vroeger hadden we linters, gevarenregels, statische analyses… op regels gebaseerd… je moet alle regels configureren”, zei Regev. “Maar het weet niet wat jij niet weet… Qodo… voelt alsof het van onze ingenieurs leert.”

Dit sluit nauw aan bij Qodo’s eigen roadmap. Het bedrijf beoordeelt niet alleen code. Het bouwt een volledig platform van ontwikkelaarsagenten, waaronder Qodo Gen voor het genereren van contextbewuste code, Qodo Merge voor geautomatiseerde PR-analyse en Qodo Cover, een regressietestagent die runtime-validatie gebruikt om testdekking te garanderen.

Dit alles wordt mogelijk gemaakt door Qodo’s eigen infrastructuur, inclusief het nieuwe open-source inbeddingsmodel, Qodo-Embed-1-1.5B, dat beter presteerde dan het aanbod van OpenAI en Salesforce op het gebied van benchmarks voor het ophalen van code.

Wat is het volgende?

Qodo biedt zijn platform nu aan onder een freemium-model: gratis voor individuen, met korting voor startups via het Perks-programma van Google Cloud, en op ondernemingsniveau voor bedrijven die SSO, air-gapped implementatie of geavanceerde controles nodig hebben.

Het bedrijf werkt al samen met teams bij NVIDIA, Intuit en andere Fortune 500-bedrijven. En dankzij een recente samenwerking met Google Cloud zijn de modellen van Qodo rechtstreeks beschikbaar in de Model Garden van Vertex AI, waardoor het gemakkelijker wordt om te integreren in bedrijfspijplijnen.

“Contextmotoren zullen het grote verhaal van 2026 zijn”, zei Friedman. “Elke onderneming zal zijn eigen tweede brein moeten bouwen als ze AI willen die hen daadwerkelijk begrijpt en helpt.”

Nu AI-systemen steeds meer ingebed raken in softwareontwikkeling, laten tools als Qodo zien hoe de juiste context – geleverd op het juiste moment – ​​de manier kan transformeren waarop teams code in de hele onderneming bouwen, verzenden en schalen.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in