De afgelopen jaren is er een hele reeks oplossingen op de markt gekomen waarmee organisaties met hun eigen data en die van hun partners kunnen werken zonder deze roekeloos bloot te stellen: clean rooms, vertrouwde onderzoeksomgevingen en tokenisatie. Deze vooruitgang ondersteunt een verschuiving naar collaboratieve intelligentie, waarbij wordt erkend dat het beperken van gegevensbronnen tot wat intern beschikbaar is, inherent resulteert in minder representatieve en onvolledige gegevens.
Geen enkele instelling beschikt over alle data die zij nodig heeft. Dit biedt enorme kansen voor sterk gereguleerde industrieën zoals de biowetenschappen en financiële instellingen om samen te werken. Het diversifiëren van datasets met partners is het opkomend tij dat alle boten optilt. Het is net zo waardevol om samen te werken met medewerkers in een ‘always on’-netwerk om in realtime inzichten te delen (bijvoorbeeld cyberveiligheidsbedreigingen of fraudesignalen).
Hoe kunnen bedrijven, terwijl er zoveel waarde wacht om aangeboord te worden, samenwerken, terwijl ze zich houden aan wettelijke vangrails en infosec-problemen, en ervoor zorgen dat gegevens veilig blijven?
Het antwoord? Federaal computergebruik.
In een exclusief interview spraken we met Chris Laws, Chief Commercial Officer bij Rhino Federated Computing, over waarom een gecentraliseerd datamodel niet langer duurzaam is en hoe federatie silogegevens binnen instellingen met elkaar verbindt.

Federaal computergebruik
Federated Computing verbindt ongelijksoortige gegevensbronnen zonder de onbewerkte gegevens zelf bloot te leggen. Alleen de inzichten worden gedeeld met gebruikers, terwijl gevoelige gegevens en intellectueel eigendom (IP) behouden blijven.
Rhino, opgericht in 2021, werkt samen met organisaties als Eli Lilly en zijn TuneLab-programma, de Cancer AI Alliance (CAIA) – die bestaat uit het Dana Farber Cancer Institute, Fred Hutch Cancer Centre, Memorial Sloan Kettering Cancer Centre, Johns Hopkins Medicine en Johns Hopkins Whiting School of Engineering – evenals de Society for Worldwide Interbank Financial Telecommunication (SWIFT), die gegevens uit vele uiteenlopende bronnen wil analyseren voor onderzoek en AI-modeltraining.
Federated Learning (FL) bestaat al tien jaar. FL traint AI rechtstreeks bij de gegevensbron, waardoor de noodzaak voor gecentraliseerde gegevensverzameling wordt geëlimineerd. Google is in 2017 begonnen met het gebruik van FL om voorspellend typen op telefoons te trainen. Datawetenschappers hebben de technologie sindsdien overgenomen en het ontpopt zich als een hulpmiddel dat echte zakelijke problemen aanpakt. Bijvoorbeeld:
- Het FAITE Consortium, een consortium voor het voorspellen van biologische eigendommen via federatief en actief leren.
- NVIDIA Merlin-framework, dat samen met Toshiba Tec en McKinsey retailgegevens omzet in realtime beslissingen.
- MELLODDY, een groep die voorspellende modellen ontwikkelt voor de ontdekking van geneesmiddelen via de Machine Learning Ledger Orchestration.
Rhino heeft het Rhino Federated Computing Platform (Rhino FCP) gebouwd om veel van de uitdagingen op te lossen waarmee gebruikers van open-source FL-frameworks worden geconfronteerd door een productieklaar systeem aan te bieden dat beveiligings- en privacycontroles aanpakt. Het kan worden geïntegreerd in de tech-stacks van organisaties, wat betekent dat het klaar is om echte zakelijke problemen op te lossen.
“Steeds vaker wordt aan leiders op het gebied van AI en datawetenschap door zakelijke sponsors gevraagd: ‘Hoe los ik een zakelijk probleem op dat samenwerking tussen silo’s vereist, op een zodanige manier dat de juridische, InfoSec- en Compliance-functies comfortabel zijn?’ – vaak zonder de woordenschat van federatief computergebruik te kennen,” zei Chris.
Rhino FCP is het antwoord op deze vragen. Het is geen stukje software dat interne ondersteuning zoekt om zijn bestaan te rechtvaardigen, noch is het een nieuwe oplossing die op zoek is naar problemen om op te lossen.
Een platform gebouwd op lokale controle
Informatie hoeft niet te worden gecentraliseerd of verzameld om organisaties te laten samenwerken. Datameren zijn vaak statisch en kunnen afhankelijk zijn van replicatie. Chris beschrijft Rhino FCP als een platform dat bovenop of naast bestaande systemen bestaat.
“In de regel spelen we graag leuk met andere technologieën”, zei hij. Als een organisatie bijvoorbeeld tijd en geld heeft besteed aan het bouwen van een pijplijn in Azure en de gegevens van een leverancier moet integreren, biedt Rhino FCP een veilige container voor analyse en samenwerking zonder de onderliggende gegevens van een van beide partijen bloot te leggen.
In veel omgevingen ontstaan er problemen wanneer een bedrijf of bedrijfseenheid weet dat zijn gegevens niet hetzelfde schema hebben als die van een ander, of wanneer informatie op intelligente wijze moet worden verzameld en daarbij strikte privacy- en veiligheidsregels moeten worden gevolgd. Dit is een wegversperring. Rhino heeft de Data Harmonization Engine gebouwd om precies dit soort problemen aan te pakken.
Het transformeert het ene datamodel in het andere, waardoor verschillende partijen met een consistent schema kunnen werken zonder dat een of beide partijen de taak hebben om datasets te normaliseren, op te schonen of te anonimiseren.
Chris zegt dat het platform zo is ontworpen dat het compatibel is met elke dataset. “We hebben doelbewust een platform gebouwd dat zo flexibel mogelijk is, dus het maakt niet uit hoe de onderliggende gegevens eruitzien”, zei hij. Of het nu gaat om gestructureerde tabellen, afbeeldingen, video of golfvormgegevens, het kan worden gefedereerd. Dit betekent dat gerichte bedrijfsresultaten en probleemoplossing kunnen worden bereikt met behulp van ongelijksoortige gegevensbronnen.
Bedrijven kunnen zelfs hun eigen applicaties als containers naar het platform brengen en deze met data laten werken. Technische teamleden die hun opties verkennen, kunnen de documentatiebibliotheek van Rhino scannen, waar ze via de SDK SQL-gebaseerde queries, Python, NVIDIA FLARE of Rhino’s Generalized Compute Code kunnen blijven gebruiken.
Of het nu gaat om bestaande algoritmische workloads of het verzamelen van databronnen voor AI-modeltraining, de datafederatietechnologieën van Rhino FCP lossen het fundamentele datalaagprobleem op dat traditionele architectuur oplegt: de vereiste om gevoelige gegevens fysiek te verplaatsen of te centraliseren voordat deze kunnen worden geanalyseerd.
Praktisch en realistisch
Laws is praktisch en realistisch in zijn beweringen, waarbij hij opmerkt dat het Rhino FCP-platform en de Data Harmonization Engine zijn klanten “90% van de weg ernaar toe” naar een uniforme databron leiden – een beetje maatwerk is onvermijdelijk. Dit staat in contrast met de gedurfde beweringen van Rhino’s concurrenten dat een groottaalmodel in de zwarte doos ‘alles aankan’.
Deze afgemeten aanpak komt voort uit de achtergrond van het bedrijf in sterk gereguleerde sectoren zoals de biowetenschappen, de gezondheidszorg en de publieke sector, waar intellectueel eigendom zich strikt aan de wettelijke vangrails moet houden. Het platform van het bedrijf spreekt daarom een nieuwe groep klanten aan uit verschillende sectoren, waaronder energie, financiële dienstverlening, automotive en landbouw.
Door data te presenteren in een samenwerkingsruimte waar normalisatie en federatie zijn ingebouwd, kunnen bedrijven hun data daadwerkelijk aan het werk zetten en inzichten verkrijgen die de netelige kwesties aanpakken die een organisatie wil oplossen.
Voor bedrijven die op zoek zijn naar een manier om de grenzen van gecentraliseerde gegevens te overschrijden en tegelijkertijd hun informatie veilig te houden, raden we aan de komende TechEx Edge Computing North America Expo in San Jose, van 18 tot 19 mei, bij te wonen en met Chris te praten op stand #269. Als wat je hier hebt gelezen je nieuwsgierig heeft gemaakt naar meer informatie, ga dan naar de website van Rhino.
(Bron afbeelding: Bronnen, Pixabay (kopafbeelding) onder licentie, RhinoFCP (geïnterviewde))


Wilt u meer leren over IoT van marktleiders? Bekijk IoT Tech Expo die plaatsvindt in Amsterdam, Californië en Londen. Het uitgebreide evenement maakt deel uit van TechEx en vindt plaats op dezelfde locatie als andere toonaangevende technologie-evenementen. Klik hier voor meer informatie.
IoT News wordt mogelijk gemaakt door TechForge Media. Ontdek hier andere aankomende zakelijke technologie-evenementen en webinars.



