2025-12-17T10:02:01.203Z
- AI kan verbazingwekkende dingen doen. Het faalt ook voortdurend in fundamentele zaken.
- Dat is geen tijdelijke situatie. Met die dichotomie zullen we nog lang te maken krijgen.
- Dat maakt voorspellingen over wat AI gaat doen om te werken, en al het andere, erg moeilijk te maken.
Soms Ik gebruik ChatGPT en het lijkt verbluffend duidelijk dat AI een transformerend effect op mijn leven zal hebben. Ik gebruik het elke dag meer.
En andere keren merk ik dat ik tegen mezelf schreeuw ChatGPT in HOOFDLETTERS, omdat het geen eenvoudige, simpele taken kan uitvoeren – taken die ik redelijkerwijs zou kunnen uitbesteden aan een vijfdeklasser. Of nog erger: het kan geen basistaken uitvoeren, maar doet het ook niet vertellen bij mij kan het ze niet, en probeert in plaats daarvan een resultaat te verdraaien. En dat maakt mij huiverig om het opnieuw te gebruiken.
Klinkt dit bekend?
Het blijkt dat de AI-business een mooie term heeft voor deze dichotomie: “De grillige grens”, bedacht in een onderzoekspaper uit 2023. Hier is een andere manier om het te zeggen: via Reuters:
“Het is misschien een Ferrari in wiskunde, maar een ezel in het noteren van dingen in je agenda”, zegt Anastasios Angelopoulos, de CEO en medeoprichter van LMArena, een populaire benchmarkingtool.
Dat citaat komt uit een rapport waarin wordt gekeken naar de problemen die verschillende bedrijven hebben gehad met het implementeren van AI in hun werk. Het is een thema waar we de afgelopen maanden veel over hebben gehoord, zoals de MIT-studie waaruit bleek dat 95% van de bedrijven ‘nul rendement’ behaalde op hun AI-investering.
Deze kwestie is de kern van de “Is AI een zeepbel en wanneer zal deze barsten?‘ vraag natuurlijk. Dat is een heel belangrijke vraag, met zo’n 2 biljoen dollar aan investeringen in het spel.
Maar ik denk dat dit niet de enige vraag is: de technologie zal niet verdwijnen, dus velen van ons zullen ongetwijfeld AI op allerlei manieren gaan gebruiken, wat er ook gebeurt.
Een meer praktische vraag is dus: welk soort taken kan AI tegenwoordig betrouwbaar goed uitvoeren – betrouwbaar genoeg zodat bedrijven (en de rest van ons) het dag in dag uit kunnen gebruiken – en welke taken zullen een tijdje duren om uit te zoeken? En welke kunnen we misschien nooit aan AI overdragen?
Dit is een behoorlijk goede samenvatting van de lopende experimenten die we momenteel in realtime uitwerken.

