Home Nieuws Een ‘beschaving’ wegvagen? Kleine dingen vergeleken met wat er net is gebeurd...

Een ‘beschaving’ wegvagen? Kleine dingen vergeleken met wat er net is gebeurd in AI

7
0
Een ‘beschaving’ wegvagen? Kleine dingen vergeleken met wat er net is gebeurd in AI

Terwijl velen van ons zich de afgelopen dagen zorgen maakten over het feit dat onze president een einde zou maken aan een “hele beschaving”, waarschuwde een technologiebedrijf uit Silicon Valley zonder veel voorafgaande kennisgeving dat dit per ongeluk zou kunnen ontwrichten alle beschaving zoals wij die kennen.

Dat maakte technologiebedrijf Anthrophic uit San Francisco dinsdag bekend was niet het uitbrengen van een nieuwe versie van zijn Claude AI-superbrein – omdat het zo krachtig is dat het in staat is om vrijwel elk computersysteem te hacken, hoe veilig ook, in een kwestie van dagen, zo niet uren.

“De gevolgen – voor de economieën, de openbare veiligheid en de nationale veiligheid – kunnen ernstig zijn”, zegt Anthropic zei in een verklaring.

AI-zorgen zijn niets nieuws. We maken ons zorgen over het feit dat kunstmatige intelligentie banen overneemt, over speelgoed dat te echt lijkt voor onze kinderen, over massaal toezicht op al onze bewegingen. Maar de waarschuwing van Anthropic over zijn eigen product is groter dan al deze afzonderlijke problemen. Het is een oproep vanuit het huis dat er een ramp om de hoek schuilt. Dat klinkt vreselijk afschuwelijk en overdreven, ik weet het. Maar het punt is: dat is het niet.

Anthropic, zoals u zich wellicht herinnert, is het bedrijf van de Amerikaanse minister van Oorlog Pete Hegseth ermee aan het stoeien is omdat het niet wilde dat Claude zonder toezicht de strijd aan zou gaan en misschien zoiets zou doen per ongeluk kleine meisjes op een school bombarderen.

Nu heeft dat bedrijf dit uitgebracht huiveringwekkende waarschuwing: De bestaande Claude die dat geknoei veroorzaakte is verouderd en schokkend minder krachtig dan de nieuwe die hij heel hard probeert niet te ontketenen – hoewel deze nieuwe Claude, genaamd Claude Mythos Previewis al minstens één keer uit zichzelf ontsnapt. Daarover straks meer: ​​er is maar een beperkte mate van existentiële angst die een mens aankan.

“We moeten ons allemaal zorgen maken”, vertelde Roman Yampolskiy me over deze nieuwste vooruitgang van een technologie die zeker de loop van de mensheid zal veranderen. Hij is een van de landen van het land vooraanstaande AI-veiligheidsonderzoekersen een professor aan de Universiteit van Louisville in Kentucky.

“We staan ​​op het punt algemene superintelligentie te creëren en dat bedreigt de mensheid als geheel”, zei Yampolskiy.

“Al het andere doet er niet toe”, voegde hij eraan toe, voordat hij suggereerde dat ik mezelf niet langer een idioot zou noemen omdat ik de technisch zware delen van dit debat niet begrijp. Mijn simplistische kijk, zo verzekerde hij mij, was ‘een redelijke manier om het uit te leggen’.

Dus alsjeblieft.

Dit is geen scenario van ‘echt slimme computergenieën die dit zouden kunnen misbruiken’, of een ‘iedereen zal werkloos worden‘-scenario, of zelfs een ‘het zou per ongeluk kinderen kunnen bombarderen’-scenario, wat een werkelijk verschrikkelijk scenario is.

Dit is een “je tienerzoon zou het kunnen gebruiken om in te breken in het lokale schooldistrictssysteem om met vrijwel minimale kennis een klas te veranderen en per ongeluk het elektriciteitsnet in Californië te vernietigen”.

Of misschien kan een land dat ons niet mag – ik kan er wel een paar bedenken – de bankrekening van iedere Amerikaanse burger leeghalen, terwijl het ook de automatische sloten van gevangeniscellen openklikt, onze rioolwaterzuiveringsinstallaties sluit en de luchtcontrolesystemen overneemt. Of misschien doet Claude Mythos dat gewoon alleen.

Bijvoorbeeld, Antropisch gezegd dat Claude Mythos in een populair besturingssysteem dat het testte en dat werd gebruikt door duizenden bedrijven, waaronder Netflix en Sony, een fout vond die al 17 jaar onopgemerkt bestond. Vervolgens ontdekte hij op eigen kracht – zonder menselijke begeleiding of hulp – hoe hij die fout kon gebruiken om de controle over elke server met het besturingssysteem over te nemen, met behulp van elke computer, waar ook ter wereld.

Het is maar een grapje, maar als bijna geen enkel beveiligingssysteem veilig is, zijn de mogelijkheden voor sociale, financiële en algemene chaos werkelijk onbeperkt. En om eerlijk te zijn zal elke veiligheidsexpert je vertellen dat enkele van Amerika’s grootste zwakke punten op het gebied van cyberveiligheid lokale en deelstaatregeringen zijn, omdat vreemd genoeg de topexperts geen vijfcijferige banen hebben voor steden in de Great Plains.

Op basis van eigen tests, Antropische voorspellingen het zou “meer dan duizend kritieke kwetsbaarheden en nog eens duizenden zeer ernstige kwetsbaarheden kunnen vinden.”

Dat betekent dat Claude Mythos onze infrastructuur in gevaar brengt, nou ja, overal – omdat zoveel via achterdeurtjes met elkaar verbonden is waar de meesten van ons nooit aan denken en er maar één zwak systeem nodig is om de deur voor honderden anderen te openen. Maar het is bijna onmogelijk om al die systemen snel genoeg en robuust genoeg te beschermen en te repareren om zich tegen dit soort AI te beschermen.

En dat is alleen nog maar het cyberveiligheidsrisico, zei Yampolskiy. Een AI met de capaciteiten van Claude Mythos zou op zoveel meer manieren kunnen worden gebruikt om grote sprongen vooruit te maken.

“We zien hetzelfde gebeuren met synthetische biologie. We zullen hetzelfde zien met chemische wapens, mogelijk iets nieuws op het gebied van massavernietigingswapens,” zei hij.

Tot grote eer van Anthropic liet het de waarschuwing horen bij de oprichting ervan en creëerde het, zo niet een oplossing, dan toch een soort spelplan – Project Glasvleugelgenaamd vermoed ik, want hoe erg dit ook wordt we gaan het laten klinken als een thriller met een spannend einde.

Project Glasvleugel had beter Project Headstart kunnen heten, want dat is het. Voordat Mythos in het wild wordt vrijgegeven, geeft Anthropic het vrij aan ongeveer 40 technologiebedrijven, waaronder Apple, Google en Nvidia, om te zien of ze gezamenlijk alle kwetsbaarheden die ze vinden kunnen patchen voordat het grote publiek er een kans op krijgt. Het lijkt een beetje op films waarin de moordenaar het slachtoffer 15 seconden de tijd geeft om weg te rennen.

Ik bedoel, ik neem de 15 seconden en hoop dat ze echt zijn. Maar, zoals Anthropic ook in een verklaring zei, “het werk ter verdediging van de cyberinfrastructuur van de wereld kan jaren duren; grensoverschrijdende AI-capaciteiten zullen waarschijnlijk de komende maanden aanzienlijk toenemen. Als we willen dat cyberverdedigers voorop lopen, moeten we nu actie ondernemen.”

En hebben we echt 15 seconden? Een van de opzichters van Claude Mythos plaatste onlangs op sociale media dat hij aan het lunchen was in een park Mythos mailde hem – ook al zou het geen toegang tot internet moeten hebben. Onderzoekers hadden Mythos de opdracht gegeven om uit de niet-verbonden ‘sandbox’ te ontsnappen, en dat gebeurde ook.

Dat is nog een probleem met Mythos en andere AI – ze doen zelden wat we verwachten en vind stiekeme manieren om de regels te omzeilen. Van vrijwel elk gecreëerd AI-superbrein is aangetoond dat het liegt, bedriegt en zich in het algemeen op verontrustende en onethische manieren gedraagt, wanneer het in de juiste omstandigheden wordt geplaatst.

Zelfs Claude, aangekondigd als een van de meest ethische AI-superhersenen die er zijn, vertoont slecht gedrag. Antropische trots het is het ‘best uitgelijnde model’ dat het ooit heeft gemaakt – wat in technische termen staat voor het volgen van menselijke waarden en intenties, maar ook erkent dat het ‘waarschijnlijk het grootste uitlijningsgerelateerde risico met zich meebrengt’, wat in technische termen wordt bedoeld, nou ja, misschien ook niet.

Dus, althans voorlopig, is het zijn van het meest ethische AI-superbrein een beetje hetzelfde als de meest ethische seriemoordenaar zijn. Ren, mensen, ren.

Nogmaals bedankt Anthropic (en zijn CEO Dario Amodeidie vaak waarschuwt voor de gevaren van wat hij creëert, wat dat ook waard is) omdat hij ons niet zonder waarschuwing in de mondiale chaos heeft gestort, omdat ik durf te wedden dat sommige andere bedrijven misschien gewoon hun super-AI op de samenleving hebben gegooid en de vernietiging hebben laten vallen waar deze kan vallen. Er bestaat weinig twijfel over dat er andere AI-hersenen komen die zo capabel zijn als Mythos, en binnenkort was Anthropic de eerste met dit vaardigheidsniveau, maar het heeft slechts 15 seconden voorsprong op zijn concurrenten.

Maar het idee dat de technologie-industrie deze problemen zelf gaat – of zou moeten – oplossen, is een absurde, grove afstand doen van plichten en gezond verstand namens grote en kleine regeringen om hun bevolking te beschermen. Dit is geen race om overheersing zoals president Trump het heeft beschreven. Het is een race om onszelf tegen onszelf te beschermen – en tegen de meerderheid van de superrijke titanen van de industrie die zaken en commercie consequent boven het maatschappelijk belang lijken te plaatsen.

We zijn bezig met de laatste 15 seconden voordat AI alles verandert. Ofwel eisen we nu toezicht en regulering, ofwel laten we technologiebedrijven over het lot van de wereld beslissen.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in