Home Nieuws Het testen van de veerkracht van software is belangrijker dan ooit

Het testen van de veerkracht van software is belangrijker dan ooit

7
0
Het testen van de veerkracht van software is belangrijker dan ooit

Wanneer internetdienstenplatform Cloudflare een storing gehad in november nam het een groot deel van de online wereld mee.

Grote platforms zoals ChatGPT, X en Canva werden onbereikbaar. Dat geldt ook voor de digitale diensten die worden aangeboden door talloze banken, detailhandelaren en vele andere bedrijven. Tijdens de zes uur durende meltdown, maar liefst 2,4 miljard gebruikers hadden de impact kunnen voelen.

Softwarestoringen als deze zijn altijd onderdeel geweest van het online leven en zullen dat ook altijd blijven doen. Maar vandaag de dag zijn onze systemen meer met elkaar verbonden dan ooit, dus een enkele storing kan naar buiten komen. AI vergroot dat risico alleen maar.

Toch ontberen te veel bedrijven nog steeds bescherming tegen dergelijke rampen. In een tijdperk waarin storingen onvermijdelijk zijn, opereren ze feitelijk zonder vangnet.

Het fundamentele ontbrekende ingrediënt is iets eenvoudigs, maar gemakkelijk over het hoofd gezien: het testen van veerkracht.

Kort gezegd gaat het bij het testen van veerkracht om het testen van uw software, voordat er problemen optreden. Het zorgt ervoor dat systemen blijven werken (of snel herstellen) als er iets misgaat.

Beschouw het testen van veerkracht als een kleine veiligheidsstap om grote problemen te voorkomen. De jaarlijkse gemiddelde kosten van een IT-storing met grote impact bedragen ongeveer $ 76 miljoen. Bedrijven kunnen ook reputatieschade oplopen, klanten verliezen en te maken krijgen met wettelijke boetes. Cloudflare is slechts een recent voorbeeld. Alleen al het afgelopen jaar AWS, Microsoft365En Sterrenlink alles ging ten onder, om er maar een paar te noemen.

Dus waarom voeren niet meer bedrijven hun software stresstests uit op onvermijdelijke mislukkingen? Dit is waarom en wat bedrijven eraan kunnen doen.

De meeste bedrijven doen geen moeite met het testen van de veerkracht

Hoe hoog de inzet ook is, bedrijven hebben redenen om het testen van de veerkracht van software te vermijden. Het proces is technisch en kan rommelig worden.

Moderne veerkrachttesten, ook wel chaos-engineering genoemd, werden vijftien jaar geleden door Netflix-softwareontwikkelaars in de schijnwerpers gezet. Ze realiseerden zich dat de enige manier om veerkracht te testen het simuleren van problemen “in het wild” of in de productie is, en creëerden een reeks gereedschappen die netwerkcrashes, meltdowns van clouddiensten en andere echte mislukkingen repliceerden.

Netflix had misschien de klappen kunnen opvangen, maar weinig andere bedrijven hebben de expertise of het lef om hun systemen op deze manier in gevaar te brengen. Het is het equivalent van het starten van een gecontroleerde brand, zodat je zeker weet dat je over de middelen beschikt om deze te blussen.

Voor het testen van veerkracht is technisch inzicht nodig om te weten welke mislukkingen moeten worden gesimuleerd en welke reacties moeten worden genomen. Het uitvoeren van deze oefeningen brengt ook risico’s met zich mee, zoals het activeren van het sprinklersysteem in uw huis, waardoor het meubilair kapot kan gaan. Het allerbelangrijkste is dat ontwikkelaars moeten weten wat ze moeten doen als tests zwakke punten aan het licht brengen.

Omdat de drempel voor het testen van veerkracht zo hoog is, is dit niet geïntegreerd in de softwareontwikkelingsprocessen van de meeste bedrijven. Er is zelden een toegewijd team, en vaak heeft niemand, behalve misschien de CTO, duidelijk de leiding. Als gevolg hiervan wordt het testen van de veerkracht een knelpunt, zodat bedrijven zich er niet mee bezig houden.

EEN BETERE WEG VOORUIT: HULP VAN AI

Het goede nieuws: het hoeft niet langer zo te zijn. Voor bedrijven die veerkrachttesten willen toepassen, maken nieuwe platforms en tools – mogelijk gemaakt door AI – het proces veiliger en gemakkelijker.

Gespecialiseerd middelen voor het testen van veerkracht stellen bedrijven nu in staat het testen te automatiseren en optimaliseren, zonder dat daar speciale experts of teams voor nodig zijn.

Ten eerste identificeert de AI-agent waarschijnlijke randgevallen: ongebruikelijke of onverwachte scenario’s die de betrouwbaarheid in gevaar kunnen brengen. Het onderzoekt systeemgedrag in de productie, hoe services met elkaar omgaan en waar vergelijkbare systemen eerder faalden.

De agent kan bijvoorbeeld een scenario benadrukken waarin een service vertraagt, in plaats van helemaal mislukt. Nog een randgeval: een code-implementatie updatet slechts de helft van de servers van het bedrijf, wat leidt tot inconsistente gebruikerservaringen.

De agent genereert vervolgens de testgevallen die het meest waarschijnlijk veerkrachtproblemen aan het licht zullen brengen en prioriteert deze, waarbij wordt uitgelegd waarom elk van deze gevallen ertoe doet. Het kan deze tests ook opzetten en uitvoeren.

Nadat problemen zijn geïdentificeerd, stelt de AI-agent gerichte oplossingen voor, waardoor de software veerkrachtiger wordt. Nu het zware werk is voltooid, kunnen ontwikkelaars deze inzichten beoordelen en toepassen.

WAAROM VEERKRACHTTESTEN NAAR LINKS MOET VERSCHUIVEN

Het hebben van de juiste tools is één ding, maar voor het effectief testen van de veerkracht is meer nodig dan alleen software.

Het creëren van een cultuur van veerkracht is een deel van de oplossing. Softwareteams moeten testen in hun routine opnemen. Uiteindelijk is de enige manier om jezelf te versterken tegen mislukkingen, door ervoor te oefenen. Als je die oefeningen nooit doet, weet je nooit hoe erg de dingen kunnen worden, totdat het te laat is.

Ontwikkelaars moeten ook onthouden dat het testen van de veerkracht niet alleen gaat over volledige uitval met vijf alarmen. Het gaat ook om kleine, gedeeltelijke storingen die een slechte gebruikerservaring voor klanten creëren, zonder noodzakelijkerwijs het hele systeem plat te leggen.

Laten we zeggen dat een platform als Cloudflare een probleem heeft met de consumentenapp van een grote bank, waardoor miljoenen mensen hun saldo niet kunnen controleren. Het testen van veerkracht moet op dit probleem anticiperen en een haalbare oplossing bieden.

Maar de beste manier om een ​​cultuur van veerkracht aan te moedigen is door ‘naar links te verschuiven’: het testen van veerkracht naar de preproductiefase van softwareontwikkeling te verplaatsen, voordat de code ooit live gaat.

Door naar links te verschuiven, kunnen teams zwakke punten ontdekken lang voordat klanten deze merken. Dat is van cruciaal belang met de huidige complexe, onderling verbonden softwaresystemen, waar ogenschijnlijk kleine problemen snel tot grote storingen kunnen leiden. In plaats van problemen tijdens live incidenten te diagnosticeren, kunnen ontwikkelaars deze in een veilige omgeving ontdekken en oplossen.

Naar links verschuiven kan ook geld en stress besparen. Het oplossen van veerkrachtproblemen in de productie is kostbaar en ontwrichtend, waardoor teamleden vaak worden weggetrokken van andere vitale taken. Door een proactieve aanpak te hanteren, kunnen ontwikkelaars en bedrijfsleiders meer vertrouwen hebben in het product dat zij aan klanten leveren.

Uiteindelijk is het testen van veerkracht geen rocket science. Bedrijven die brandoefeningen houden voor hun software en een cultuur omarmen waarin de veerkracht wordt getest, zullen zich in een sterkere positie bevinden wanneer de volgende verstoring zich voordoet. En in een steeds meer onderling verbonden wereld, waar AI-tools en -functies afhankelijk zijn van meer onderliggende diensten dan ooit, is het veilig om te zeggen dat dit eerder vroeg dan laat zal zijn.

Jyoti Bansal is CEO van Harnas.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in