In de winter van 2022, toen de technische wereld gebiologeerd raakte door de plotselinge, explosieve komst van OpenAI’s ChatGPT, Benjamin Alarie stond voor een cruciale keuze. Zijn juridische technologie-startup, Blauw Jhad een respectabel bedrijf gebouwd op de AI van vervlogen tijden, dat honderden accountantskantoren van voorspellende modellen voorzag. Maar het had een plafond bereikt.
Alarie, een hoogleraar belastingrecht bij de Universiteit van Torontozag de opkomende, foutgevoelige maar krachtige mogelijkheden van grote taalmodellen niet als een curiosum, maar als de toekomst. Hij nam een beslissing waarbij veel op het spel stond: zijn hele bedrijf, dat in bijna tien jaar met veel moeite was opgebouwd, van de grond af opnieuw opbouwen op basis van deze onbewezen technologie.
Die weddenschap heeft goed uitbetaald. Blue J heeft sindsdien stilletjes een Serie D van $ 122 miljoen financieringsronde mede geleid door Eiken HC/FT En Saffier ondernemingenwaarbij de waardering van het bedrijf wordt geplaatst op ruim $300 miljoen. Deze stap transformeerde Blue J van een nichespeler tot een van Canada’s snelstgroeiende juridische technologiebedrijven, waardoor de omzet ongeveer vertwaalfvoudigde en elke dag 10 tot 15 nieuwe klanten aantrok.
Het bedrijf bedient nu meer dan 3.500 organisaties, waaronder de wereldwijde boekhoudgigant KPMG en verschillende Fortune 500-bedrijven. Het pakt een cruciaal knelpunt in de professionele dienstverlening aan: een ernstig en steeds groter wordend tekort aan talent. De VS hebben 340.000 accountants minder dan vijf jaar geledenen aangezien 75% van de huidige CPA’s naar verwachting in de komende tien jaar met pensioen zullen gaan, zijn bedrijven wanhopig op zoek naar instrumenten die de productiviteit van hun resterende experts kunnen vergroten.
“Waar belastingprofessionals ooit 15 uur handmatig onderzoek voor nodig hadden, kan nu met Blue J in ongeveer 15 seconden worden voltooid”, zei Alarie, de CEO van het bedrijf, in een exclusief interview met VentureBeat. “Die waardepropositie – we kunnen uren werk vergen en er seconden werk van maken – is de drijvende kracht achter dit alles.”
Toen de biografie van de decaan niet klopte: het moment dat alles veranderde
Alarie herinnert zich januari 2023 nog levendig, toen de decaan van de rechtenfaculteit langskwam op zijn kantoor voor nieuwjaarswensen. Hij vroeg haar naar ChatGPT en vroeg de AI om haar te beschrijven. ChatGPT genereerde vol vertrouwen een biografie. Sommige details klopten. Anderen waren volledig verzonnen.
“Ze zei: ‘Oké, dit is echt eng. Dit is verkeerd en dit heeft gevolgen'”, zei Alarie. Toch heeft dat moment van duidelijke mislukking hem niet afgeschrikt. In plaats daarvan kristalliseerde het zijn overtuiging.
De eerste versie van het bedrijf, gelanceerd in 2015, maakte gebruik van machinaal leren onder toezicht om voorspellende modellen te bouwen die gerechtelijke uitkomsten over specifieke belastingkwesties konden voorspellen. Hoewel het technisch geavanceerd was, had het een fundamentele fout: het kon niet elke vraag over belastingonderzoek beantwoorden.
“De uitdaging was dat het niet elke vraag over belastingonderzoek kon beantwoorden, wat eigenlijk de heilige graal was”, zegt Alarie. Klanten waren dol op de tool als deze op hun probleem van toepassing was, maar zouden er snel afstand van doen als dat niet het geval was. De omzet bleef rond de $ 2 miljoen per jaar liggen.
Ondanks de beruchte hallucinaties van ChatGPT overtuigde Alarie zijn bestuur om de draai te maken. ‘Ik was ervan overtuigd dat als we op die weg doorgingen, we onze grootste beperking niet zouden kunnen aanpakken’, zei hij. “Grote taalmodellen leken een veelbelovende richting.”
Hij gaf zijn team zes maanden de tijd om een werkend product af te leveren.
Van reacties van 90 seconden op 3 miljoen vragen: hoe Blue J AI-hallucinaties temde
Tegen augustus 2023 Blauw J was klaar om te lanceren. Wat ze uitbrachten was, volgens Alarie’s openhartige oordeel, ‘super janky’. Het systeem had 90 seconden nodig om te reageren. Ongeveer de helft van de antwoorden bevatte problemen. De Net Promoter Score ingeschreven op slechts 20.
Wat dat gebrekkige product transformeerde tot het platform van vandaag – met responstijden gemeten in seconden, een ontevredenheidspercentage van slechts één op de 700 zoekopdrachten en een NPS-score halverwege de jaren ’80 – was een meedogenloze focus op drie strategische pijlers.
Ten eerste is er op grote schaal bedrijfseigen inhoud. Blauw J beveiligde exclusieve licenties met Belastinganalisten (belastingtoelichting) En IBFDde in Amsterdam gevestigde mondiale belastingdienst die meer dan 220 rechtsgebieden bestrijkt. “Wij zijn het enige platform ter wereld dat de beste Amerikaanse belastinginformatie van Tax Notes en de beste mondiale belastinginformatie van IBFD opneemt”, aldus Alarie.
Ten tweede is er diepgaande menselijke expertise. Blue J heeft belastingdeskundigen in dienst onder leiding van Susan Masseydie 13 jaar bij de IRS-kantoor van hoofdadviseur als vestigingshoofd Vennootschapsbelasting. Haar team test voortdurend de AI en verfijnt de prestaties ervan.
Ten derde is er een ongekend feedbackvliegwiel. Met meer dan 3 miljoen verwerkte belastingonderzoeken in 2025 verzamelt Blue J ongeëvenaarde gegevens. Elke zoekopdracht genereert feedback die terugvloeit naar het systeem.
Het wekelijkse actieve gebruikerspercentage schommelt tussen 75% en 85%, vergeleken met 15% tot 25% voor traditionele platforms. “Een liefdadigheidsratio is alsof we vijf keer intensiever worden gebruikt”, merkte Alarie op.
Een kijkje in de early access-samenwerking van Blue J met OpenAI
Blue J onderhoudt een ongewoon nauwe relatie met OpenAI dat cruciaal is gebleken voor het succes ervan. “We hebben een zeer goede relatie met OpenAI en krijgen vroegtijdig toegang tot hun modellen”, aldus Alarie. “Het werkt behoorlijk samen. We geven ze veel feedback van zeer hoge kwaliteit over hoe goed verschillende versies van toekomstige modellen presteren.”
Deze feedback blijkt waardevol omdat Blue J wat Alarie ‘ecologisch geldige’ testvragen noemt, heeft ontwikkeld op basis van daadwerkelijke vragen van belastingprofessionals, waarbij de juiste antwoorden zijn bepaald door het deskundige team van Blue J. Dit helpt OpenAI de prestaties bij complexe redeneringstaken te verbeteren.
Het bedrijf test modellen van alle grote aanbieders – Open AI, Antropisch, Google’s Tweelingenen open source-alternatieven – voortdurend evalueren welke het beste presteert. “We zijn niet noodzakelijkerwijs 100% toegewijd aan een bepaalde aanbieder”, legde hij uit. “We zijn de hele tijd aan het testen.”
Deze aanpak helpt Blauw J navigeren door een uitdagend bedrijfsmodel: jaarlijks ongeveer $ 1.500 per stoel in rekening brengen voor onbeperkte zoekopdrachten, terwijl de variabele computerkosten worden geabsorbeerd. “We hebben ons er vooraf toe verbonden om hen een echt goede gebruikerservaring te bieden, onbeperkte antwoorden op belastingonderzoek tegen een vaste prijs”, aldus Alarie. “Wij absorberen een groot deel van dat risico.”
Concurrentie tussen aanbieders van basismodellen zorgt voor een neerwaartse druk op de API-prijzen, terwijl de conservatieve gebruiksmodellering van Blue J accuraat is gebleken. De retentie van bruto-inkomsten bedraagt meer dan 99%, terwijl de retentie van netto-inkomsten 130% bedraagt – wat als de beste in zijn soort wordt beschouwd voor SaaS-bedrijven.
Neem het op tegen Thomson Reuters en LexisNexis met een wekelijkse betrokkenheid van 75%
Blauw J wordt geconfronteerd met concurrentie van gevestigde uitgevers zoals ThomsonReuters, LexisNexisEn Bloombergdie allemaal AI-mogelijkheden aankondigden in 2023 en 2024. Toch suggereren de betrokkenheidsstatistieken van Blue J dat het een aanzienlijk momentum heeft veroverd, van slechts 200 klanten in 2021 naar meer dan 3.500 organisaties vandaag.
De dagelijkse updates blijken cruciaal. Terwijl de belastingwet zelf alleen verandert als het Congres in actie komt, evolueert het ecosysteem voortdurend door IRS-regelgeving, nieuwe uitspraken en rechtszaken. Alle 50 staten wijzigen hun belastingcodes regelmatig.
“Dingen veranderen letterlijk elke dag”, zei Alarie. “Elke dag werken we de materialen bij, en dat is alleen de VS. We bestrijken Canada, we bestrijken het Verenigd Koninkrijk. De ambities zijn werkelijk mondiaal voor dit ding.”
De ambities van Alarie reiken verder dan het bouwen van een succesvolle startup. Als auteur van het bekroonde boek “De juridische singulariteit” en faculteitsfiliaal bij de Vector Instituut voor Kunstmatige Intelligentieheeft hij jarenlang nagedacht over de langetermijnimpact van AI op het recht.
In academische artikelen die overal in Tax Notes zijn gepubliceerd 2023 En 2024legde hij de opkomst van generatieve AI vast, waarbij hij voorspelde dat “klanten aanzienlijk geavanceerder zullen worden” en dat AI menselijke experts naar strategischere rollen met een hogere waarde zou duwen in plaats van routinematig onderzoek.
Blue J’s plan van $ 122 miljoen: van belastingonderzoek naar ‘wereldwijde belastingkennis’
De Serie D-financieringwaardoor het totale opgehaalde kapitaal op meer dan $133 miljoen kwam, zal een agressieve geografische en productuitbreiding stimuleren. Blue J is al actief in de VS, Canada en Groot-Brittannië, met plannen om uiteindelijk meer dan 220 rechtsgebieden te bestrijken via zijn IBFD-partnerschap.
Toekomstige mogelijkheden zouden kunnen bestaan uit het automatisch genereren van memo’s, het invullen van belastingformulieren, het opstellen van documenten en het bijhouden van de gespreksgeschiedenis, waarbij de context tussen sessies behouden blijft. Zo wordt Blue J getransformeerd van een onderzoeksinstrument naar wat Alarie omschrijft als ‘de operationele laag voor mondiale belastingkennis’.
Ondanks al zijn succes opereert Blue J in een domein waar fouten ernstige gevolgen hebben. Het hallucinatieprobleem is niet geëlimineerd; het is geminimaliseerd door zorgvuldige engineering, contentbeheer en menselijk toezicht. Blue J heeft zijn modellen getraind om te herkennen wanneer ze een vraag niet kunnen beantwoorden in plaats van informatie te verzinnen.
Het bedrijf wordt ook geconfronteerd met economische risico’s als de computerkosten stijgen of de gebruikspatronen de projecties overschrijden. En subtielere vragen doemen op over het professionele oordeel: zullen gebruikers, naarmate AI-systemen capabeler worden, hun resultaten uitstellen zonder voldoende kritische evaluatie?
Van 15 uur tot 15 seconden: wat de AI-spil van Blue J elke branche leert
De transformatie van Blue J biedt lessen die verder gaan dan belastingsoftware. De bereidheid van het bedrijf om acht jaar propriëtaire technologie achter zich te laten en opnieuw op te bouwen op een aanvankelijk onbetrouwbare basis vereiste zowel moed als het nemen van berekende risico’s.
De beslissing wierp geen vruchten af omdat generatieve AI inherent superieur was aan machinaal leren onder toezicht in alle dimensies, maar omdat het het juiste probleem aanpakte: alomvattendheid in plaats van precisie in beperkte domeinen. Belastingprofessionals hadden geen behoefte aan een nauwkeurigheid van 95% op 5% van de vragen. Ze hadden een voldoende nauwkeurigheid nodig voor 100% van de vragen.
De verbetering van een NPS van 20 naar 84 in iets meer dan twee jaar weerspiegelt de meedogenloze iteratie op basis van massale gegevensverzameling. De contentpartnerschappen creëerden differentiatie die pure technologie niet kon repliceren. Het team van belastingexperts leverde domeinkennis die nodig is om de betrouwbaarheid te garanderen.
Het meest fundamentele was dat Blue J inzag dat de echte concurrentie niet bestond uit andere AI-startups of zelfs maar gevestigde uitgevers. Het was de oude manier van werken: vijftien uur handmatig onderzoek, de institutionele kennis die opgesloten zat in de hoofden van gepensioneerde professionals.
“Mensen zeggen: ‘Wat doet Blue J? Ze bieden betere belastingantwoorden. Oké, ik denk dat we dat nodig hebben'”, dacht Alarie na.
Terwijl AI beroep na beroep transformeert, kan die helderheid van doel belangrijker zijn dan technologische verfijning. De toekomst behoort niet toe aan degenen die de meest geavanceerde AI bouwen, maar aan degenen die deze het meest effectief inzetten om problemen op te lossen die mensen daadwerkelijk hebben.
Voor een hoogleraar belastingrecht die begon met frustratie over inefficiënte onderzoeksmethoden, is het opzetten van een bedrijf ter waarde van $300 miljoen een gedurfd eindpunt. Voor de duizenden professionals die nu complexe vragen in 15 seconden in plaats van 15 uur beantwoorden, vertegenwoordigt dit de toekomst van hun beroep, sneller dan verwacht.
De weddenschap op ChatGPT toen het nog hallucinerende biografieën was, is een bevestiging geworden dat soms de meest riskante zet is om helemaal niet te bewegen.



