Home Nieuws Rapidata komt naar voren om de ontwikkelingscycli van AI-modellen te verkorten van...

Rapidata komt naar voren om de ontwikkelingscycli van AI-modellen te verkorten van maanden naar dagen met bijna realtime RLHF

2
0
Rapidata komt naar voren om de ontwikkelingscycli van AI-modellen te verkorten van maanden naar dagen met bijna realtime RLHF

Ondanks het groeiende geroezemoes over een toekomst waarin veel menselijk werk wordt geautomatiseerd door AI, is een van de ironieën van de huidige technologische hausse de hardnekkige afhankelijkheid van mensen, met name het proces van het trainen van AI-modellen met behulp van versterkend leren van menselijke feedback (RLHF).

In zijn eenvoudigste vorm is RLHF een begeleidingssysteem: nadat een AI is getraind op samengestelde gegevens, maakt hij nog steeds fouten of klinkt hij robotachtig. Menselijke contractanten worden vervolgens massaal ingehuurd door AI-laboratoria om de output van een nieuw model te beoordelen en te rangschikken terwijl het traint, en het model leert van hun beoordelingen en past zijn gedrag aan om hogere outputs te bieden. Dit proces is des te belangrijker naarmate AI zich uitbreidt om multimedia-uitvoer zoals video, audio en beeldmateriaal te produceren, die wellicht meer genuanceerde en subjectieve kwaliteitsmaatstaven hebben.

Historisch gezien is dit begeleidingsproces een enorme logistieke hoofdpijn en PR-nachtmerrie geweest voor AI-bedrijven, die afhankelijk waren van gefragmenteerde netwerken van buitenlandse aannemers en statische etiketteringspools in specifieke geografische hubs met lage inkomens. door de media als laag loon bestempeld – zelfs uitbuitend. Het is ook inefficiënt: AI-labs moeten weken of maanden wachten op een enkele batch feedback, waardoor de voortgang van het model wordt vertraagd.

Nu is er een nieuwe startup ontstaan ​​die het proces veel efficiënter maakt: SnelHet platform van RLHF ‘gamificeert’ effectief door genoemde beoordelingstaken over de hele wereld naar bijna 20 miljoen gebruikers van populaire apps, waaronder Duolingo of Candy Crush, te pushen in de vorm van korte, opt-in beoordelingstaken die ze kunnen voltooien in plaats van naar mobiele advertenties te kijken, waarbij de gegevens onmiddellijk worden teruggestuurd naar een AI-laboratorium dat de opdracht heeft gekregen.

Zoals gedeeld met VentureBeat in een persbericht, stelt dit platform AI-laboratoria in staat om “modellen in bijna realtime te herhalen”, waardoor de ontwikkelingstijden aanzienlijk worden verkort in vergelijking met traditionele methoden.

CEO en oprichter Jason Corkill verklaarde in dezelfde release dat Rapidata “menselijk oordeel beschikbaar maakt op mondiale schaal en bijna realtime, waardoor een toekomst wordt ontgrendeld waarin AI-teams constante feedbackloops kunnen uitvoeren en systemen kunnen bouwen die elke dag evolueren in plaats van elke releasecyclus.”

Rapidata-oprichter en CEO Jason Corkill. Krediet: Rapidata

Rapidata beschouwt RLHF als hogesnelheidsinfrastructuur en niet als een handarbeidsprobleem. Vandaag heeft het bedrijf ons exclusief op VentureBeat zijn opkomst aangekondigd met een startronde van $8,5 miljoen, mede geleid door Canaan Partners en IA Ventures, met deelname van Acequia Capital en BlueYard, om zijn unieke benadering van on-demand menselijke data op te schalen.

Het cafégesprek dat een menselijke wolk bouwde

Het ontstaan ​​van Rapidata ontstond niet in een directiekamer, maar aan een tafel met een paar biertjes. Toen Corkill een student was aan de ETH Zürich, waar hij werkte in robotica en computer vision, toen hij tegen de muur stuitte waar elke AI-ingenieur uiteindelijk mee te maken krijgt: het knelpunt bij de data-annotatie.

“Concreet werk ik al een aantal jaren in robotica, AI en computervisie, heb aan de ETH hier in Zürich gestudeerd en was altijd gefrustreerd door het annoteren van gegevens”, herinnerde Corkill zich in een recent interview. “Altijd als je mensen of menselijke data-annotatie nodig had, dan werd je project een beetje stopgezet, want tot dan toe kon je het vooruit helpen door gewoon langere nachten aan te houden. Maar als je grootschalige menselijke annotatie nodig had, moest je naar iemand toe gaan en dan een paar weken wachten”.

Gefrustreerd door deze vertraging realiseerden Corkill en zijn medeoprichters zich dat het bestaande arbeidsmodel voor AI fundamenteel kapot was voor een wereld die beweegt met de snelheid van de moderne computertechnologie. Terwijl de rekenkracht exponentieel schaalt, doet de traditionele menselijke beroepsbevolking – gebonden aan handmatige onboarding, regionale aanwervingen en langzame betalingscycli – dat niet. Rapidata is ontstaan ​​uit het idee dat menselijk oordeel kan worden geleverd als een wereldwijd verspreide, vrijwel onmiddellijke dienst.

Technologie: digitale voetafdrukken omzetten in trainingsgegevens

De kerninnovatie van Rapidata ligt in de distributiemethode. In plaats van fulltime annotators in specifieke regio’s in te huren, maakt Rapidata gebruik van de bestaande aandachtseconomie van de mobiele app-wereld. Door samen te werken met apps van derden, zoals Candy Crush of Duolingo, biedt Rapidata gebruikers de keuze: een traditionele advertentie bekijken of een paar seconden besteden aan het geven van feedback voor een AI-model.

“Aan de gebruikers wordt gevraagd: ‘Hé, zou je liever, in plaats van naar advertenties te kijken en bedrijven die je ogen op die manier kopen, liever wat gegevens willen annoteren en feedback willen geven?'” legde Corkill uit. Volgens Corkill kiest tussen de 50% en 60% van de gebruikers voor de feedbacktaak boven een traditionele videoadvertentie.

Deze ‘crowd intelligence’-benadering stelt AI-teams in staat om op een ongekende schaal gebruik te maken van een diverse, mondiale demografie.

  • Het mondiale netwerk: Rapidata bereikt momenteel tussen de 15 en 20 miljoen mensen.

  • Enorm parallellisme: Het platform kan in één uur 1,5 miljoen menselijke annotaties verwerken.

  • Snelheid: Feedbackcycli die voorheen weken of maanden duurden, worden teruggebracht tot uren of zelfs minuten.

  • Kwaliteitscontrole: Het platform bouwt in de loop van de tijd vertrouwens- en expertiseprofielen op voor respondenten, waardoor complexe vragen worden gematcht met de meest relevante menselijke juryleden.

  • Anonimiteit: Hoewel gebruikers worden gevolgd via geanonimiseerde ID’s om consistentie en betrouwbaarheid te garanderen, verzamelt Rapidata geen persoonlijke identiteiten, waardoor de privacy behouden blijft en de gegevenskwaliteit wordt geoptimaliseerd.

Online RLHF: overstappen naar de GPU

De belangrijkste technologische sprong die Rapidata mogelijk maakt, is wat Corkill omschrijft als “online RLHF”. Traditioneel wordt AI getraind in niet-verbonden batches: je traint het model, stopt, stuurt gegevens naar mensen, wacht weken op labels en gaat dan verder. Hierdoor ontstaat een ‘cirkel’ van informatie waarin vaak geen nieuwe menselijke inbreng aanwezig is.

Rapidata verplaatst dit oordeel rechtstreeks naar de trainingslus. Omdat hun netwerk zo snel is, kunnen ze via API rechtstreeks integreren met de GPU’s waarop het model draait.

“We hebben altijd het idee gehad om het leren van menselijke feedback te versterken… tot nu toe moest je het altijd in batches doen”, zei Corkill. “Als je nu helemaal naar beneden gaat, hebben we nu een paar klanten waar we, omdat we zo snel zijn, direct, eigenlijk in het proces, kunnen zijn, zoals in de processor aan de rechterkant van de GPU, en de GPU berekent wat output, en hij kan ons onmiddellijk op een gedistribueerde manier verzoeken. ‘Oh, ik heb, ik heb, ik heb een mens nodig om hiernaar te kijken.’ Ik krijg het antwoord en pas dan dat verlies toe, wat tot nu toe niet mogelijk is geweest”.

Momenteel ondersteunt het platform ongeveer 5.500 mensen per minuut en levert live feedback aan modellen die op duizenden GPU’s draaien. Dit voorkomt ‘hacking van beloningsmodellen’, waarbij twee AI-modellen elkaar voor de gek houden in een feedbacklus, door de training te baseren op daadwerkelijke menselijke nuances.

Product: Oplossen voor smaak en mondiale context

Terwijl AI verder gaat dan eenvoudige objectherkenning naar generatieve media, zijn de vereisten voor het labelen van gegevens geëvolueerd van objectieve tagging naar subjectieve, op smaak gebaseerde curatie. Het gaat niet langer alleen om “is dit een kat?” maar eerder “is deze stemsynthese overtuigend?” of “welke van deze twee samenvattingen voelt professioneler aan?”.

Lily Clifford, CEO van de stem-AI-startup Rime, merkt op dat Rapidata transformatief is geweest voor het testen van modellen in reële contexten. “Vroeger betekende het verzamelen van zinvolle feedback het samenvoegen van leveranciers en enquêtes, segment voor segment of land voor land, wat niet schaalde”, aldus Clifford. Met behulp van Rapidata kan Rime de juiste doelgroepen bereiken – of dat nu in Zweden, Servië of de Verenigde Staten is – en zien hoe modellen presteren in echte klantworkflows in dagen, in plaats van maanden.

“De meeste modellen zijn feitelijk correct, maar ik weet zeker dat je e-mails hebt ontvangen die, weet je, niet authentiek aanvoelen, toch?” merkte Corkill op. “Je kunt een AI-e-mail ruiken, je kunt een AI-afbeelding of een video ruiken, het is je meteen duidelijk… deze modellen voelen nog steeds niet menselijk aan, en daarvoor heb je menselijke feedback nodig.”

De economische en operationele verschuiving

Vanuit operationeel oogpunt positioneert Rapidata zichzelf als een infrastructuurlaag die de noodzaak voor bedrijven elimineert om hun eigen aangepaste annotatiebewerkingen te beheren. Door een schaalbaar netwerk aan te bieden, verlaagt het bedrijf de toegangsdrempel voor AI-teams die voorheen worstelden met de kosten en complexiteit van traditionele feedbackloops.

Jared Newman van Canaan Partners, die de investering leidde, suggereert dat deze infrastructuur essentieel is voor de volgende generatie AI. “Elke serieuze AI-implementatie is ergens in de levenscyclus afhankelijk van het menselijk oordeel”, zegt Newman. “Naarmate modellen overgaan van op expertise gebaseerde taken naar op smaak gebaseerde curatie, zal de vraag naar schaalbare menselijke feedback dramatisch groeien”.

Een toekomst van menselijk gebruik

Terwijl de huidige focus ligt op de modellaboratoria van de Bay Area, ziet Corkill een toekomst waarin de AI-modellen zelf de belangrijkste klanten van het menselijk oordeel worden. Hij noemt dit ‘menselijk gebruik’.

In deze visie zou een auto-ontwerper AI niet zomaar een generiek voertuig genereren; het zou Rapidata programmatisch kunnen oproepen om 25.000 mensen op de Franse markt te vragen wat zij van een specifieke esthetiek vinden, die feedback te herhalen en het ontwerp binnen enkele uren te verfijnen.

“De samenleving is voortdurend in beweging”, merkte Corkill op, waarmee hij inging op de trend om AI te gebruiken om menselijk gedrag te simuleren. “Als ze nu een samenleving simuleren, zal de simulatie een paar maanden stabiel zijn en misschien een spiegelbeeld zijn van de onze, maar dan verandert het compleet, omdat de samenleving veranderd is en zich totaal anders heeft ontwikkeld.”

Door een gedistribueerde, programmatische manier te creëren om wereldwijd toegang te krijgen tot de menselijke hersencapaciteit, positioneert Rapidata zichzelf als de essentiële verbinding tussen silicium en de samenleving. Met 8,5 miljoen dollar aan nieuwe financiering is het bedrijf van plan agressief te werk te gaan om ervoor te zorgen dat naarmate de AI zich verder uitbreidt, het menselijke element niet langer een knelpunt is, maar een realtime kenmerk.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in