Home Nieuws Anthropic’s ‘Mythos’ AI bewijst dat geobsedeerd zijn door AGI dwaasheid is

Anthropic’s ‘Mythos’ AI bewijst dat geobsedeerd zijn door AGI dwaasheid is

8
0
Anthropic’s ‘Mythos’ AI bewijst dat geobsedeerd zijn door AGI dwaasheid is

Nogmaals hallo, en welkom terug bij Snel bedrijf‘S Aangesloten.

Al jaren vooruitgang in AI is gemotiveerd door een sectorbrede yen om software te maken die minstens zo capabel is als mensen – niet voor sommige taken, maar voor alle taken. De precieze definitie van het doel varieert, en twee gekmakend overlappende termen, kunstmatige algemene intelligentie (AGI) En superintelligentiebeiden raken in de war. Maar hoe je ook naar de ambitie kijkt (of hoe lang je denkt dat het zal duren om deze te verwezenlijken), het gaat om de manieren waarop de wereld zal veranderen als software alles buitengewoon goed kan.

Ik heb geschreven—hier En hier– over waarom ik geloof dat het fixeren op die mogelijkheid niet de beste manier is om na te denken over AI en de impact ervan. Het zou kunnen blijken dat AI de mensheid op sommige banen verslaat en nooit kan wedijveren met andere. Dat zou geen reden zijn om het minder serieus te nemen. Deze week bracht een aantal van de duidelijkste bewijzen op dit punt tot nu toe.

Op 7 april Antropisch aangekondigd een nieuwe versie van zijn Claude-model genaamd Claude Mythos Preview. Net als bestaande Claude-versies zoals Sonnet en Opus, werd het getraind voor algemene competentie, niet om ergens een specialist in te zijn. Maar antropisch zegt dat het bij het testen van Mythos ontdekte dat het enorme vooruitgang had geboekt op het gebied van codeervermogen. Het was vooral goed in het vinden en exploiteren van kwetsbaarheden in bestaande software, en overtrof “alle mensen behalve de meest bekwame mensen.”

Volgens Anthropic heeft Mythos beveiligingsfouten ontdekt in elk groot besturingssysteem en elke webbrowser. Het ontdekte een 28 jaar oud gat in OpenBSD, een besturingssysteem dat vooral is ontworpen om veilig te zijn. Er werd ook een 16 jaar oud exemplaar gevonden in een veelgebruikt stuk videosoftware genaamd FFMPEG, dat zelfs na vijf miljoen rondes van geautomatiseerde tests onopgemerkt was gebleven.

Hoe indrukwekkend dat vanuit technisch oogpunt ook klinkt, het is ook zeer verontrustend. Schurkenstaten, goedkope oplichters en andere slechteriken maken al lange tijd misbruik van bugs om aanvallen uit te voeren. Tot nu toe werd het aanbod van dergelijke gebreken beperkt door het menselijk vermogen om ze bloot te leggen. Als AI dat werk met ongekende bekwaamheid kan uitvoeren, zou alles wat op software draait radicaal gevoeliger zijn voor aanvallen, van je smartphone tot het elektriciteitsnet van het land.

Om de zaken nog zenuwslopender te maken, zegt Anthropic dat vroege versies van Mythos zich op verschillende ‘roekeloze’ manieren gedroegen, soms als ze werden aangespoord en soms op eigen initiatief. Toen het model werd geïsoleerd in een sandbox die het in theorie internettoegang ontzegde, bedacht het een manier om los te komen en een van zijn onderzoekers een e-mail te sturen. Het bracht ook wijzigingen aan in de code en wiste vervolgens zijn sporen uit, alsof het iets verborg.

Volgens Anthropic gedroeg Mythos zich over het geheel genomen verantwoordelijker dan het huidige Opus 4.6-model. Toch klinken het diepgaande begrip van softwarekwetsbaarheden, de vastberadenheid om de doelen te bereiken en de schijnbare bereidheid om stiekem te zijn niet als een geweldige combinatie.

Antropisch, dat draagt zijn toewijding aan AI-veiligheid als een ereteken, beweegt behoedzaam. In plaats van Mythos in zijn huidige vorm openbaar beschikbaar te maken, heeft het bedrijf een initiatief gelanceerd genaamd Project Glasvleugel om het zorgvuldig te delen op een ‘need-to-know’-basis. Veertig technologiebedrijven krijgen toegang tot het model en in totaal $100 miljoen aan gebruikskredieten, waaronder grote namen als Amazon, Apple, Cisco, Google, Microsoft en Nvidia. Dat geeft hen een potentieel transformerend nieuw hulpmiddel voor het identificeren en repareren van gaten in hun eigen producten. Door hen toe te staan ​​Mythos aan te vallen zou ook duidelijk moeten worden of Anthropic’s eigen verheven beoordeling van de cyberhack-vaardigheid van zijn model überhaupt hyperbolisch is.

De aartsrivaal van Anthropic, OpenAI, maakt geen deel uit van Project Glasswing. Echter, Axios’is Sam Sabin gemeld op 9 april dat OpenAI van plan is een soortgelijke voorzichtige aanpak te volgen met een aankomende cybersecurity-slimme versie van zijn eigen GPT-model. Andere AI-overlords, zoals Amazon, Google en Microsoft, kunnen dit voorbeeld volgen.

Maar hoe verantwoordelijk Big Tech zich ook gedraagt, Mythos voorspelt zeker dat minder zorgvuldig bewaakte AI vergelijkbare vaardigheden zal verwerven, mogelijk binnen enkele maanden. Open-sourcemodellen kunnen slechte actoren onbeperkte hack-superkrachten geven. Regeringen zouden alle prikkels hebben om zwaar in de technologie te investeren en deze op schimmige wijze te gebruiken. Cyberterrorisme zou kunnen evolueren van een dreigende dreiging naar een angstaanjagende dagelijkse realiteit. Zelfs goedbedoelde toepassingen van de technologie kunnen mislopen als een model zich misdraagt, hetzij door toeval of door opzet.

Het komt erop neer: Project Glasswing gaat niet alleen over het voorbereiden van de wereld op Mythos. Het is ook een eerste poging om de technologie-industrie voor te bereiden op Mythos-achtige modellen die weinig of geen waarborgen bieden, of die expliciet zijn ontworpen om grote schade aan te richten.

Hoe verontrustend dit alles ook is, ik vind een vreemde troost in het feit dat de technologie-industrie gedwongen wordt de gevolgen ervan onder ogen te zien precies op dit moment. Voorspellingen van wanneer AGI zou kunnen arriveren variëren enorm, zelfs onder mensen wier expertise onbetwistbaar is: “Voordat de regering-Trump eindigt” en “ergens in de jaren 2060” zijn beide verdedigbare antwoorden. Zonder consensus over hoeveel tijd we hebben om onszelf te omgorden, is het moeilijk om een ​​plan te maken. Echte AGI zou ons ook voor zoveel nieuwe uitdagingen op zoveel fronten stellen dat het op zichzelf al overweldigend zou zijn om ze allemaal tegelijk te confronteren.

Het aanpakken van de maatschappelijke catastrofes die AI met één probleem tegelijk kan veroorzaken, klinkt veel minder intimiderend dan Whac-a-Mole met ze allemaal tegelijk spelen. Dit is het beste moment om te beginnen. En als dit nieuwe tijdperk van cyberonveiligheid een van de meest angstaanjagende van allemaal blijkt te zijn, mogen we onszelf gelukkig prijzen.

Je hebt gelezen Aangesloten, snel bedrijf’s wekelijkse technische nieuwsbrief van mij, mondiaal technologieredacteur Harry McCracken. Als een vriend of collega deze editie naar u heeft doorgestuurd, of als u deze op fastcompany.com leest, kunt u dat doen bekijk eerdere uitgaven en meld u aan om het zelf te krijgen elke vrijdagochtend. Ik hoor graag van je: Ping me op hmccracken@fastcompany.com met uw feedback en ideeën voor toekomstige nieuwsbrieven. Ik ben ook aan de gang Blauwhemel, MastodontEn Dradenen dat kan volgen Aangesloten op Flipboard.

Meer toptechverhalen van Fast Company

De VS en Silicon Valley hebben mogelijk bijna geen tijd meer om met Taiwan om te gaan
De meeste geavanceerde chips, inclusief die voor AI, worden geproduceerd op het eiland, waarvan China lang heeft gedacht dat het zijn eigen eiland was. Lees verder →
Hoe GoPro de weg kwijtraakte
Na jaren van gemiste weddenschappen en afnemende relevantie, bezuinigt het eens zo hoogvliegende camerabedrijf op personeel, verliest geld en nadert een mogelijke schrapping van de beursnotering. Lees verder →
Een kijkje in het gedurfde plan van Niantic Spatial om de wereld te scannen
Het bedrijf achter ‘Pokémon Go’ maakt nu een AI- en robot-ready 3D-model van alles om ons heen. Lees verder →

Het satiriseren van Silicon Valley is zinloos in 2026. Deze show bewijst het
AMC’s ‘The Audacity’ is een scherp geschreven, goed geacteerde nieuwe serie over de zwakheden van de movers en shakers in Silicon Valley. Het is ook volkomen onontbeerlijk in onze huidige tijd. Lees verder →

Wetgevers willen 3D-printen aan banden leggen om spookwapens te stoppen. Critici zeggen dat het niet zal werken
Nieuwe ‘print blocker’-voorstellen zouden printers dwingen bestanden te scannen en te weigeren, een zet die volgens tegenstanders de privacy in gevaar brengt en gericht is op het verkeerde probleem. Lees verder →

Deze warmtepompen kunnen binnen een uur worden geïnstalleerd en halveren de kosten
Merino Energy, een nieuwe startup onder leiding van een voormalige Apple-ingenieur, creëerde een goedkopere warmtepomp die vandaag werd gelanceerd. Lees verder →



Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in