Home Nieuws Voorbij het meer: ​​NEXUS van Fundamental omzeilt handmatige ETL met een eigen...

Voorbij het meer: ​​NEXUS van Fundamental omzeilt handmatige ETL met een eigen basismodel voor tabelgegevens

2
0
Voorbij het meer: ​​NEXUS van Fundamental omzeilt handmatige ETL met een eigen basismodel voor tabelgegevens

De deep learning-revolutie heeft een merkwaardige blinde vlek: de spreadsheet. Terwijl Large Language Models (LLM’s) de nuances van menselijk proza ​​onder de knie hebben en beeldgeneratoren het digitale canvas hebben veroverd, worden de gestructureerde, relationele gegevens die ten grondslag liggen aan de wereldeconomie – de rijen en kolommen van ERP-systemen, CRM’s en financiële grootboeken – tot nu toe behandeld als gewoon een ander bestandsformaat dat lijkt op tekst of pdf’s.

Bedrijven moesten daardoor bedrijfsresultaten voorspellen met behulp van het typische op maat gemaakte, arbeidsintensieve data science-proces van handmatige feature-engineering en klassieke machine learning-algoritmen die dateren van vóór het moderne deep learning.

Maar nu Fundamenteeleen in San Francisco gevestigd AI-bedrijf dat mede is opgericht door DeepMind-alumni, is dat wel gaat vandaag van start met een totale financiering van $255 miljoen om deze kloof te overbruggen.

Het bedrijf komt uit stealth en introduceert NEXUS, een Large Tabular Model (LTM) dat is ontworpen om bedrijfsgegevens niet als een eenvoudige reeks woorden te behandelen, maar als een complex web van niet-lineaire relaties.

Fundamentele medeoprichters Jeremy Fraenkel, Annie Lamont en Gabriel Suissa. Krediet: fundamenteel

De technologie: verder gaan dan sequentiële logica

De meeste huidige AI-modellen zijn gebaseerd op sequentiële logica: het voorspellen van het volgende woord in een zin of de volgende pixel in een frame.

Bedrijfsgegevens zijn echter inherent niet-sequentieel. Het churnrisico van een klant is niet slechts een tijdlijn; het is een multidimensionaal kruispunt van transactiefrequentie, sentiment voor supporttickets en regionale economische verschuivingen. Bestaande LLM’s worstelen hiermee omdat ze slecht geschikt zijn voor de beperkingen op het gebied van grootte en dimensionaliteit van tabellen op bedrijfsschaal.

“De meest waardevolle gegevens ter wereld bevinden zich in tabellen en tot nu toe is er geen goed basismodel gebouwd dat specifiek is gebouwd om deze te begrijpen”, zegt Jeremy Fraenkel, CEO en medeoprichter van Fundamental.

In een recent interview met VentureBeat benadrukte Fraenkel dat hoewel de AI-wereld geobsedeerd is door tekst, audio en video, tabellen de grootste modaliteit voor ondernemingen blijven. “LLM’s kunnen dit soort gegevens echt niet zo goed verwerken”, legt hij uit, “en bedrijven vertrouwen momenteel op zeer ouderwetse machine learning-algoritmen om voorspellingen te doen.”

NEXUS is getraind op miljarden real-world tabellarische datasets met behulp van Amazon SageMaker HyperPod. In tegenstelling tot traditionele XGBoost- of Random Forest-modellen, waarbij datawetenschappers handmatig functies moeten definiëren – de specifieke variabelen waar het model naar moet kijken – is NEXUS ontworpen om onbewerkte tabellen rechtstreeks op te nemen.

Het identificeert latente patronen in kolommen en rijen die menselijke analisten mogelijk over het hoofd zien, waardoor de verborgen taal van het raster effectief wordt gelezen om niet-lineaire interacties te begrijpen.

De tokenisatieval

Een van de belangrijkste redenen waarom traditionele LLM’s falen bij het verwerken van tabelgegevens, is de manier waarop ze getallen verwerken. Fraenkel legt uit dat LLM’s getallen op dezelfde manier tokeniseren als woorden, door ze in kleinere stukken op te delen. “Het probleem is dat ze hetzelfde toepassen op getallen. Tabellen zijn over het algemeen allemaal numeriek”, merkte Fraenkel op. “Als je een getal als 2.3 hebt, worden de ‘2’, de ‘.’ en de ‘3’ gezien als drie verschillende tokens. Dat betekent in wezen dat je het begrip van de verdeling van getallen verliest. Het is niet zoals een rekenmachine; je krijgt niet altijd het juiste antwoord omdat het model het concept van getallen niet van nature begrijpt.”

Bovendien zijn tabelgegevens order-invariant op een manier die taal niet is. Fraenkel gebruikt een voorbeeld uit de gezondheidszorg om dit te illustreren: “Als ik je een tabel geef met honderdduizenden patiënten en je vraag te voorspellen wie van hen diabetes heeft, zou het niet uit moeten maken of de eerste kolom lengte is en de tweede kolom gewicht, of omgekeerd.”

Hoewel LLM’s zeer gevoelig zijn voor de volgorde van woorden in een prompt, is NEXUS ontworpen om te begrijpen dat verschuivende kolomposities geen invloed mogen hebben op de onderliggende voorspelling.

Opererend op de voorspellende laag

Recente spraakmakende integraties, zoals Claude van Anthropic verschijnt rechtstreeks in Microsoft Excelhebben gesuggereerd dat LLM’s al tabellen oplossen.

Fraenkel onderscheidt het werk van Fundamental echter als opererend op een fundamenteel andere laag: de voorspellende laag. “Wat ze doen is hoofdzakelijk op de formulelaag: formules zijn tekst, ze lijken op code”, zei hij. “We proberen u niet toe te staan ​​een financieel model in Excel te bouwen. Wij helpen u een prognose te maken.”

NEXUS is ontworpen voor beslissingen in een fractie van een seconde waarbij een mens niet betrokken is, zoals een creditcardmaatschappij die bepaalt of een transactie frauduleus is op het moment dat u veegt.

Terwijl tools zoals Claude een spreadsheet kunnen samenvatten, is NEXUS gebouwd om de volgende rij te voorspellen – of het nu gaat om een ​​defect aan apparatuur in een fabriek of de kans dat een patiënt opnieuw wordt opgenomen in een ziekenhuis.

Architectuur en beschikbaarheid

De kernwaardepropositie van Fundamenteel is de radicale reductie van de time-to-insight. Traditioneel kan het bouwen van een voorspellend model maanden van handarbeid vergen.

“Je moet een leger datawetenschappers inhuren om al die datapijplijnen te bouwen om de data te verwerken en op te schonen”, legt Fraenkel uit. “Als er ontbrekende waarden of inconsistente gegevens zijn, zal je model niet werken. Je moet die pijplijnen voor elk afzonderlijk gebruik bouwen.”

Fundamentele claims NEXUS vervangt dit hele handmatige proces door slechts één regel code. Omdat het model vooraf is getraind op een miljard tabellen, vereist het niet hetzelfde niveau van taakspecifieke training of feature-engineering als traditionele algoritmen.

Terwijl Fundamental zich van de stealth-fase naar de bredere markt begeeft, doet het dit met een commerciële structuur die is ontworpen om de traditionele wrijving van de adoptie van bedrijfssoftware te omzeilen.

Het bedrijf heeft al verschillende zevencijferige contracten binnengehaald met Fortune 100-organisaties, een prestatie die mogelijk wordt gemaakt door een strategische go-to-market-architectuur waarbij Amazon Web Services (AWS) fungeert als de recordverkoper op de AWS Marketplace.

Hierdoor kunnen bedrijfsleiders NEXUS aanschaffen en implementeren met behulp van bestaande AWS-credits, waardoor voorspellende intelligentie effectief wordt behandeld als een standaardhulpprogramma naast rekenkracht en opslag. Voor de ingenieurs die met de implementatie zijn belast, is de ervaring ingrijpend maar weinig wrijving; NEXUS werkt via een op Python gebaseerde interface op een puur voorspellende laag in plaats van op een conversatielaag.

Ontwikkelaars verbinden onbewerkte tabellen rechtstreeks met het model en labelen specifieke doelkolommen (zoals een kredietverzuimkans of een onderhoudsrisicoscore) om de prognose te activeren. Het model retourneert vervolgens regressies of classificaties rechtstreeks naar de bedrijfsdatastack en functioneert als een stille, snelle engine voor geautomatiseerde besluitvorming in plaats van als een op chat gebaseerde assistent.

De maatschappelijke inzet: voorbij de bottom line

Hoewel de commerciële implicaties van vraagvoorspelling en prijsvoorspelling duidelijk zijn, benadrukt Fundamental het maatschappelijke voordeel van voorspellende intelligentie.

Het bedrijf benadrukt belangrijke gebieden waarop NEXUS catastrofale gevolgen kan voorkomen door signalen te identificeren die verborgen zijn in gestructureerde gegevens.

Door sensorgegevens en onderhoudsgegevens te analyseren, kan NEXUS storingen zoals leidingcorrosie voorspellen. Het bedrijf wijst op de Flint-watercrisis – die meer dan 1 miljard dollar aan reparaties heeft gekost – als een voorbeeld waarbij voorspellende monitoring levensbedreigende besmetting had kunnen voorkomen.

Op dezelfde manier kostten tekorten aan persoonlijke beschermingsmiddelen tijdens de COVID-19-crisis ziekenhuizen in één jaar tijd 323 miljard dollar. Fundamenteel stelt dat NEXUS, door productie- en epidemiologische gegevens te gebruiken, tekorten 4 tot 6 weken vóór de piek in de vraag kan voorspellen, waardoor er op tijd een noodproductie in gang kan worden gezet om levens te redden.

Op het gebied van het klimaat wil NEXUS voorspellingen doen over overstromingen en droogte over een periode van 30 tot 60 dagen, zoals voor de overstromingen in Pakistan in 2022, die voor 30 miljard dollar aan schade veroorzaakten.

Ten slotte wordt het model gebruikt om het risico op heropname in ziekenhuizen te voorspellen door de demografische gegevens van patiënten en sociale determinanten te analyseren. Zoals het bedrijf het stelt: “Een alleenstaande moeder met twee banen zou niet opnieuw op de Eerste Hulp moeten belanden omdat we niet hadden voorspeld dat ze vervolgzorg nodig zou hebben.”

Prestaties versus latentie

In de zakenwereld verschilt de definitie van beter per bedrijfstak. Voor sommigen is het snelheid; voor anderen is het ruwe nauwkeurigheid.

“Wat de latentie betreft, hangt het af van de use case”, legt Fraenkel uit. “Als je een onderzoeker bent die probeert te begrijpen welke medicijnen je moet toedienen aan een patiënt in Afrika, doet de latentie er niet zoveel toe. Je probeert een nauwkeuriger besluit te nemen dat uiteindelijk de meeste levens kan redden.”

Voor een bank of hedgefonds daarentegen vertaalt zelfs een marginale toename in nauwkeurigheid zich in enorme waarde.

“Het verhogen van de voorspellingsnauwkeurigheid met een half procent is voor een bank miljarden dollars waard”, zegt Fraenkel. “Voor verschillende gebruiksscenario’s verandert de omvang van het stijgingspercentage, maar we kunnen u betere prestaties leveren dan wat u momenteel heeft.”

Ambitieuze visie krijgt veel steun

De $225 miljoen kostende Series A, geleid door Oak HC/FT met deelname van Salesforce Ventures, Valor Equity Partners en Battery Ventures, getuigt van de overtuiging dat tabelgegevens de volgende grote stap zijn.

Opmerkelijke engelinvesteerders, waaronder leiders van Perplexity, Wiz, Brex en Datadog, bevestigen de stamboom van het bedrijf verder.

Annie Lamont, medeoprichter en managing partner bij Oak HC/FT, verwoordde het sentiment: “De betekenis van het Fundamental-model kan moeilijk worden overschat: gestructureerde, relationele gegevens moeten de voordelen van de deep learning-revolutie nog zien.”

Fundamenteel positioneert zichzelf niet alleen als een zoveelste AI-tool, maar als een nieuwe categorie van zakelijke AI. Met een team van ongeveer 35 medewerkers gevestigd in San Francisco beweegt het bedrijf zich van het tijdperk van op maat gemaakte modellen naar een tijdperk van basismodellen voor tafels.

“Die traditionele algoritmen zijn de afgelopen tien jaar hetzelfde geweest; ze verbeteren niet”, zei Fraenkel. “Onze modellen worden steeds beter. We doen hetzelfde voor tabellen als ChatGPT voor tekst.”

Samenwerken met AWS

Via een strategisch partnerschap met Amazon Web Services (AWS) is NEXUS rechtstreeks geïntegreerd in het AWS-dashboard. AWS-klanten kunnen het model implementeren met behulp van hun bestaande credits en infrastructuur. Fraenkel omschrijft dit als een “zeer unieke overeenkomst”, waarbij hij opmerkt dat Fundamental een van de slechts twee AI-bedrijven is die zo’n diepgaand, meergelaagd partnerschap met Amazon hebben opgebouwd.

Een van de belangrijkste hindernissen voor zakelijke AI is gegevensprivacy. Bedrijven zijn vaak niet bereid gevoelige gegevens naar een infrastructuur van derden te verplaatsen.

Om dit op te lossen hebben Fundamental en Amazon een enorme technische prestatie geleverd: de mogelijkheid om volledig gecodeerde modellen (zowel de architectuur als de gewichten) rechtstreeks in de eigen omgeving van de klant in te zetten. “Klanten kunnen erop vertrouwen dat de gegevens bij hen blijven”, aldus Fraenkel. “Wij zijn het eerste en momenteel enige bedrijf dat een dergelijke oplossing heeft gebouwd.”

De opkomst van Fundamental is een poging om het besturingssysteem voor zakelijke beslissingen opnieuw te definiëren. Als NEXUS presteert zoals geadverteerd – het omgaan met financiële fraude, energieprijzen en verstoringen van de toeleveringsketen met één enkel, algemeen model – zal dit het moment markeren waarop AI eindelijk leert de spreadsheets te lezen die feitelijk de wereld besturen. The Power to Predict gaat niet langer over kijken naar wat er gisteren is gebeurd; het gaat over het blootleggen van de verborgen taal van tabellen om te bepalen wat er morgen gebeurt.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in