Home Nieuws AI is nog steeds zowel meer als minder verbazingwekkend dan we denken,...

AI is nog steeds zowel meer als minder verbazingwekkend dan we denken, en dat is een probleem

4
0
AI is nog steeds zowel meer als minder verbazingwekkend dan we denken, en dat is een probleem

Nogmaals hallo, en welkom terug bij Snel bedrijf‘S Aangesloten.

Een blogpost van 9 februari over AIgetiteld “Er gebeurt iets groots”, schoot deze week over het internet op een manier die me deed denken aan de gouden eeuw van de blogosfeer. Iedereen leek erover te praten – hoewel, zoals vroeger vaak het geval was, de viraliteit ervan werd aangewakkerd door een krachtige cocktail van aanbidding en minachting. De reacties varieerden van “Stuur dit naar iedereen waar je om geeft” tot “Ik koop dit helemaal niet.”

De auteur, Matt Shumer (die zijn bericht de volgende dag op X deelde), is de CEO van een startup genaamd OthersideAI. Hij legde uit dat hij het richtte tot “mijn familie, mijn vrienden, de mensen om wie ik geef, die mij blijven vragen: ‘Wat is er aan de hand met AI?’ en een antwoord krijgen dat geen recht doet aan wat er feitelijk gebeurt.”

Volgens Shumer is de deal met AI dat de nieuwste modellen – met name OpenAI’s GPT-5.3 Codex en Anthropic’s Claude Opus 4.6 – radicale verbeteringen zijn ten opzichte van alles wat eraan voorafging. En dat AI plotseling zo bekwaam is in het schrijven van code dat de hele software-engineering een nieuw tijdperk is binnengegaan. En dat AI binnenkort beter zal zijn dan mensen in het kernwerk van een reeks andere beroepen: “Rechten, financiën, geneeskunde, boekhouding, advies, schrijven, ontwerp, analyse, klantenservice.”

Tegen het einde van de post, met een ademnood die me aan deed denken de millennium-bug-doemdenkers van 1999Shumer adviseert lezers om spaargeld op te bouwen, schulden te minimaliseren en hun kinderen misschien aan te moedigen om AI-tovenaars te worden in plaats van zich te concentreren op de universiteit, in de verwachting dat dit tot een solide carrière zal leiden. Hij suggereert dat iedereen die de komende zes maanden niet vooroploopt op AI, afstevent op irrelevantie.

Het stuk – dat Shumer verteld New York’s Benjamin Hart schreef hij met overvloedige hulp van AI – is niet zonder punten. Sommige mensen die op dit moment blasé zijn over AI zullen zeker verbaasd zijn over de impact ervan op werk en leven in de komende jaren. Daarom ondersteun ik van harte de aanbeveling van Shumer dat iedereen de technologie beter leert kennen door er een uur per dag aan te rommelen. Veel slimme mensen in Silicon Valley delen het ontzag van Shumer voor de recente gigantische sprong voorwaarts op het gebied van codeervaardigheden van AI. schreef over afgelopen week. Je afvragen wat er zal gebeuren als het op andere gebieden wordt herhaald, is een volkomen redelijke mentale oefening.

Maar uiteindelijk zou Shumer een veel betere zaak hebben gehad als hij 70% minder over de top was geweest. (Ik moet opmerken dat de laatste keer dat hij in het nieuws was, het was omdat hij beweringen deed over de benchmarkprestaties van een AI-model waarbij hij betrokken was bleek niet waar te zijn.) Zijn bericht lijdt aan een tekortkoming die veel voorkomt in het gesprek over AI: het is zo onder de indruk van de technologie dat het weigert de ernstige beperkingen te erkennen die het nog steeds heeft.

Shumer suggereert bijvoorbeeld dat hallucinatie – AI die woordreeksen aan elkaar rijgt die feitelijk klinken maar dat niet zijn – een opgelost probleem is. Hij schrijft dat ChatGPT een paar jaar geleden “vol vertrouwen dingen zei die onzin waren” en dat “in AI-tijd dat oude geschiedenis is.”

Het is waar dat de nieuwste modellen niet hallucineren met zoiets als het verlaten van hun voorgangers. Maar ze verzinnen nog steeds dingen. En in tegenstelling tot eerdere modellen klinken hun hallucinaties eerder plausibel dan duidelijk belachelijk, wat een stap in de verkeerde richting is.

Dezelfde dag dat ik het stuk van Shumer las, praatte ik met Claude Opus 4.6 over krantenstrips – een onderwerp dat ik vaak gebruik om AI te beoordelen omdat ik er genoeg van weet om de reacties direct te kunnen beoordelen – en het was vreselijk over het associëren van cartoonisten met de strips waaraan ze daadwerkelijk hebben gewerkt. Hoe meer we praatten, hoe minder accuraat het werd. Het blonk in ieder geval uit in het erkennen van de fouten: toen ik er één aanwees, vertelde het me: “Dus eigenlijk had ik fragmenten van echte informatie door elkaar gegooid en gepresenteerd met vals vertrouwen. Niet geweldig.”

Nadat hij nog een van mijn stripgerelateerde vragen had verprutst, zei Claude: “Ik begeef me hier eigenlijk op wankel terrein en haal wat details door elkaar”, en vroeg me om te helpen het in de goede richting te sturen. Dat is een intrigerend sprankje zelfbewustzijn over zijn eigen neiging om te fantaseren, en over een soort vooruitgang. Maar totdat AI stopt met confabuleren, is het onzin om het te omschrijven als ‘slimmer dan de meeste PhD’s’, zoals Shumer doet. (Dat blijf ik geloven menselijke capaciteiten zijn geen goede maatstaf voor AIwat in sommige dingen al beter is dan wij en in andere misschien wel permanent achterblijft.)

Shumer loopt ook voorop in zijn veronderstellingen over waar AI op de korte termijn zou kunnen staan ​​als het gaat om het competent kunnen vervangen van menselijk denken en werken. Schrijvend over het soort complexe werktaken die hij aanbeveelt om AI als experiment te gebruiken, zegt hij: “Als dat al zo is soort van Als het vandaag werkt, kun je er vrijwel zeker van zijn dat het over zes maanden vrijwel perfect zal werken.” Dat lijkt buitengewoon onwaarschijnlijk, aangezien allerlei generatieve AI vastzit in de ‘vriendelijk-of-works”-tijdperk al jaren. Een goede vuistregel: geloof niet dat AI iets goed zal kunnen totdat het dat ook daadwerkelijk doet.

Uiteindelijk is de conclusie uit de post van Shumer die ik me het meest zal herinneren niets wat hij heeft geschreven. In de geest van AI-experimenten heb ik zijn stuk voorgelegd aan ChatGPT, Gemini en Claude met de opdracht “Geef me een analyse/kritiek op dit essay. Vertel me of het overdreven voorzichtig is, niet voorzichtig genoeg, wat je eigen mening is over de besproken onderwerpen, enz.” Ik was erop voorbereid dat ze allemaal zouden reageren met iets gemakkelijks maar oppervlakkigs, meer een korte samenvatting dan wat dan ook. ChatGPT en Gemini voldeden aan die verwachtingen.

Echter, Claude’s swing op het onderwerp – dat binnen enkele seconden naar voren kwam, en dat kan ook lees hier het geheel– ik schrok ervan. Het ging over een aantal van dezelfde dingen in het stuk die mij stoorden, maar bracht ook andere zwakke punten naar voren waar ik nog niet aan had gedacht. Ik voelde me slimmer nadat ik het had gelezen, wat nog steeds niet is wat ik van AI-proza ​​verwacht.

Een paar nuggets:

Codering is een bijzonder gunstig domein voor AI: de resultaten zijn verifieerbaar, de feedbackloops zijn nauw, de trainingsgegevens zijn overvloedig en de omgeving is volledig digitaal. Bij advocatuur, geneeskunde en management gaat het om ambiguïteit, institutionele context, menselijke relaties, regelgevende verantwoordelijkheid en vijandige dynamieken die kwalitatief verschillend zijn. Hij erkent dit even en wuift het vervolgens weg.

….

Ja, veel mensen hebben GPT-3.5 geprobeerd en het hele veld afgeschreven. Dat is een echt probleem. Maar veel serieuze, huidige gebruikers – inclusief mensen die voor de beste modellen betalen – stuiten nog steeds op aanzienlijke beperkingen: hallucinaties (verminderd maar niet geëlimineerd), broosheid bij nieuwe problemen, onvermogen om een ​​samenhangende context over echt lange projecten te behouden, slechte kalibratie over de eigen onzekerheid, en moeite met taken die een echte basis vereisen. Shumer beschouwt alle scepticisme als achterhaald, wat intellectueel oneerlijk is.

….

Hij houdt zich ook niet serieus bezig met de mogelijkheid dat de economische prikkels misschien niet zo soepel verlopen als “AI kan het werk doen, daarom verdwijnt het werk.” Adoptiewrijving is reëel. Aansprakelijkheidsproblemen zijn reëel. Organisatorische inertie is reëel. De geschiedenis van de technologie suggereert dat zelfs transformatieve instrumenten er veel langer over doen om industrieën te herstructureren dan de tijdlijn van pure capaciteiten doet vermoeden. Het kostte elektriciteit tientallen jaren om de productie opnieuw vorm te geven, zelfs nadat elektriciteit duidelijk superieur was aan stoom.

Ik denk dat het onderliggende signaal waar Shumer naar verwijst reëel is. De mogelijkheden van AI verbeteren sneller dan de meeste mensen buiten de sector beseffen, en de kloof tussen de publieke perceptie en de huidige realiteit is werkelijk groot. Hij heeft gelijk dat de meeste mensen serieuzer met deze tools zouden moeten omgaan dan ze al doen.

Maar ik denk dat het essay iets doet dat heel gebruikelijk is in Silicon Valley: het verwarren van de potentieel traject voor de onvermijdbaar traject, en het comprimeren van tijdlijnen op basis van vibraties en extrapolatie in plaats van serieus te worstelen met de vele fricties in de echte wereld die de adoptie vertragen. Het stuk leest alsof het is geschreven in de onmiddellijke emotionele nasleep van de indruk van een nieuwe modelrelease – en die momenten leiden vaak tot overmoed over het tempo.

Om samen te vatten: op dezelfde dag dat ik Claude Opus 4.6 iets over Shumer’s stuk zag schrijven dat niet alleen coherent maar ook inzichtelijk was, veranderde het ook in een hallucinogene aanval. Dat is precies hoe AI tegenwoordig is: verbazingwekkend en verschrikkelijk tegelijk. Op de een of andere manier is die realiteit voor veel waarnemers moeilijk te accepteren. Maar elke analyse die dit negeert, loopt het risico een ernstige verkeerde inschatting te maken van wat er daarna zal komen.

Je hebt gelezen Aangesloten, snel bedrijf’s wekelijkse technische nieuwsbrief van mij, mondiaal technologieredacteur Harry McCracken. Als een vriend of collega deze editie naar u heeft doorgestuurd, of als u deze op fastcompany.com leest, kunt u dat doen bekijk eerdere uitgaven en meld u aan om het zelf te krijgen elke vrijdagochtend. Ik hoor graag van je: Ping me op hmccracken@fastcompany.com met uw feedback en ideeën voor toekomstige nieuwsbrieven. Ik ben ook aan de gang Blauwhemel, MastodontEn Dradenen dat kan volgen Aangesloten op Flipboard.

Meer toptechverhalen van Fast Company

Ontwikkelaars wegen nog steeds de voor- en nadelen van AI-codeermiddelen af
De tools blijven het moeilijk hebben als ze rekening moeten houden met grote hoeveelheden context in complexe projecten. Lees verder →

AI-expert voorspelde dat AI in 2027 een einde zou maken aan de mensheid – nu verandert hij zijn tijdlijn
De voormalige OpenAI-medewerker heeft het einde van de wereld verplaatst. Lees verder →

Discord vraagt ​​om je identiteitsbewijs. De reactie gaat over meer dan alleen privacy
Critici zeggen dat verplichte leeftijdsverificatie een diepere verschuiving weerspiegelt in de richting van routinematige identiteitscontroles en digitale surveillance. Lees verder →

Een medeoprichter van Palantir steunt een groep die Alex Bores aanvalt vanwege zijn werk met . . . Palantir
Huidige en voormalige werknemers vertellen Fast Company dat de advertentiecampagne wordt aangedreven door verzet tegen de steun van de Democratische hoopvolle voor AI-regulering. Lees verder →

De nieuwe profielanimatiefunctie van Facebook is Boomerang voor het AI-tijdperk
De functie maakt deel uit van een bredere drang naar AI-inhoud in meta-apps. Lees verder →

Het zakenimperium van MrBeast reikt veel verder dan virale YouTube-video’s
Bankapps, snacks, streaminghits en datatools maken allemaal deel uit van Jimmy Donaldsons groeiende portefeuille van $ 5 miljard onder Beast Industries. Lees verder →


Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in