Home Nieuws Amazon scherpt de codevangrails aan na storingen die de detailhandel doen wankelen

Amazon scherpt de codevangrails aan na storingen die de detailhandel doen wankelen

5
0
Amazon scherpt de codevangrails aan na storingen die de detailhandel doen wankelen

Amazone versterkt de interne vangrails nadat recente storingen de e-commerceactiviteiten van het bedrijf hebben getroffen, waaronder één verstoring die verband hield met de AI-codeerassistent Q.

Dave Treadwell, Amazon’s SVP e-commercediensten, vertelde het personeel dinsdag dat er sinds het derde kwartaal van 2025 een “trend van incidenten” is ontstaan, waaronder “verschillende grote” incidenten in de afgelopen weken, volgens een intern document verkregen door Business Insider. Minstens één van deze verstoringen hield verband met de AI van Amazon codeerassistent Qterwijl anderen diepere kwesties blootlegden, legde een ander intern document uit.

Problemen waren onder meer wat hij omschreef als “veranderingen in de straal van de explosie”, waarbij software-updates zich breed verspreidden omdat controlevliegtuigen geen geschikte beveiliging hadden. (Een controlevlak bepaalt hoe gegevens over een computernetwerk stromen).

In andere gevallen duurde het uren voordat de datacorruptie tot rust kwam. Sommige fouten waren terug te voeren op basismechanismen, zoals de vereiste dat twee mensen codewijzigingen moesten autoriseren, die ontbraken of werden omzeild.

Als reactie hierop introduceert Amazon strengere controles, waardoor technici codewijzigingen grondiger moeten documenteren en aanvullende goedkeuringen moeten verkrijgen. Tegelijkertijd ontwikkelt het bedrijf andere waarborgen die bedoeld zijn om wat leidinggevenden omschrijven als ‘gecontroleerde wrijving’ te introduceren in het beoordelingsproces van codewijzigingen.

“We implementeren tijdelijke veiligheidspraktijken die gecontroleerde wrijving zullen introduceren in veranderingen in de belangrijkste delen van de retailervaring”, schreef Treadwell dinsdag in het document. “Tegelijkertijd zullen we investeren in duurzamere oplossingen, die zowel deterministische als agentische waarborgen omvatten.”

De Amazon-snafus zijn een voorbeeld van hoe generatieve AI de manier waarop software wordt geschreven, gecontroleerd en verzonden op zijn kop zet. AI-coderingsdiensten, zoals Claude Code en het Q- en Kiro-aanbod van Amazon, helpen ingenieurs veel meer code te produceren dan in het verleden. Deze code moet echter nog steeds worden gecontroleerd op bugs en andere potentiële problemen voordat deze op de wereld wordt gezet. Wanneer deze lawine van nieuwe code traditionele software-reviewprocessen treft, kunnen er problemen ontstaan.

‘Agentisch’ versus ‘deterministisch’

Treadwell van Amazon schreef dat de nieuwe codevangrails van het bedrijf AI-gestuurde, ‘agentische’ tools zullen combineren met meer voorspelbare, op regels gebaseerde ‘deterministische’ systemen.

Hiermee wordt een van de kernproblemen van AI-modellen aangepakt. Deze krachtige nieuwe diensten zijn niet deterministisch. Dat betekent dat je dezelfde vraag twee keer kunt stellen en dat een AI-model misschien iets andere antwoorden uitspuugt. Dat maakt deze technologie soms ongeschikt voor bedrijfsworkflows die elke keer 100% accuraat moeten zijn. Dat omvat de kernsoftwaresystemen voor Enterprise Resource Planning en is waarschijnlijk van toepassing op cruciale zaken als product-, prijs-, bestel- en transactiegegevens op een gigantische e-commercemarktplaats, zoals die van Amazon.

Eerder op dinsdag hield Treadwell een bijeenkomst met enkele medewerkers van Amazon om te bespreken hoe de recente problemen konden worden aangepakt. Een woordvoerder van Amazon vertelde Business Insider dat de bijeenkomst deel uitmaakte van een reguliere wekelijkse evaluatie en dat het cloudbedrijf Amazon Web Services niet betrokken was bij een van deze incidenten.

“Als onderdeel van de normale bedrijfsvoering zal de bijeenkomst een beoordeling omvatten van de beschikbaarheid van onze website en app, terwijl we ons concentreren op voortdurende verbetering”, aldus de woordvoerder.

GenAI zal “de blootstelling versnellen”

Volgens de interne documenten vonden enkele van de ernstigste verstoringen vorige week plaats.

Op 2 maart zagen klanten op Amazon-marktplaatsen onjuiste levertijden bij het toevoegen van artikelen aan hun winkelwagentje. Het incident leidde tot bijna 120.000 verloren bestellingen en ongeveer 1,6 miljoen websitefouten. Volgens een interne review was de AI-tool Q van Amazon een van de belangrijkste bijdragers aan de gebeurtenis.

“Het gebruik van GenAI bij operaties met controlevliegtuigen zal de blootstelling van scherpe randen en plaatsen waar geen vangrails bestaan, versnellen”, aldus een intern document over het incident van 2 maart. “We hebben investeringen nodig in de veiligheid van controlevliegtuigen.”

Op 5 maart, nog een storing veroorzaakte een daling van 99% in het aantal bestellingen op de Noord-Amerikaanse marktplaatsen van Amazon, resulterend in 6,3 miljoen verloren bestellingen, aldus een van de interne documenten. Eén belangrijke factor was een productiewijziging die werd doorgevoerd zonder gebruik te maken van een formeel documentatie- en goedkeuringsproces, genaamd Modeled Change Management.

“Geen geautomatiseerde validatie vóór de implementatie”, aldus het document. “Enkele geautoriseerde operator kan een configuratiewijziging met een grote straal uitvoeren zonder vangrails.”

Een woordvoerder van Amazon vertelde Business Insider dat slechts één incident dat dinsdag werd beoordeeld, verband hield met AI, en dat bij geen van deze incidenten sprake was van door AI geschreven code.

Een veiligheidsreset van 90 dagen

Nu introduceert Amazon een tijdelijke veiligheidsrichtlijn van 90 dagen die volgens een van de interne documenten als aanvulling op het bestaande beleid zal dienen.

Het nieuwe beleid richt zich op ongeveer 335 ‘Tier-1-systemen’, oftewel diensten die een directe impact kunnen hebben op consumenten, die sinds vorig jaar meerdere incidenten hebben meegemaakt die de bestelling beïnvloeden en die eigendom zijn van organisaties op VP-niveau.

Volgens het nieuwe beleid moeten Amazon-ingenieurs twee mensen hun werk laten beoordelen voordat ze codewijzigingen aanbrengen. Ze moeten ook gebruik maken van een interne documentatie- en goedkeuringstool en een geautomatiseerd coderingssysteem dat strikt voldoet aan de centrale regels voor betrouwbaarheidstechniek van Amazon.

Amazon brengt ook alle eigenaren van Tier-1-systemen op de hoogte, evenals leiders op Director- en VP-niveau, en instrueert hen om alle activiteiten voor het wijzigen van productiecodes binnen hun organisaties te controleren.

De Amazon-woordvoerder vertelde Business Insider dat het niet juist is om te zeggen dat junior- en mid-level engineers verplicht zijn om goedkeuring te krijgen van senior engineers voor eventuele door AI ondersteunde wijzigingen.

De Financial Times meldde eerder dat Amazon dinsdag een ‘deep dive’-bijeenkomst hield over de storingen en dat de Kiro AI-coderingstool van het bedrijf in december gedeeltelijk een 13 uur durende AWS-servicestoring veroorzaakte.

Heeft u een tip? Neem contact op met deze verslaggever via e-mail op ekim@businessinsider.com of Signal, Telegram of WhatsApp op 650-942-3061. Gebruik een persoonlijk e-mailadres, een niet-werkelijk wifi-netwerk en een niet-werkapparaat; hier is onze gids voor het veilig delen van informatie.



Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in