Home Nieuws Maak kennis met de kleine groep ingenieurs die het publiek helpen de...

Maak kennis met de kleine groep ingenieurs die het publiek helpen de Epstein-bestanden te doorzoeken

3
0
Maak kennis met de kleine groep ingenieurs die het publiek helpen de Epstein-bestanden te doorzoeken

Nadat ambtenaren miljoenen pagina’s met documenten hebben vrijgegeven die verband houden met wijlen zedendelinquent Jeffrey Epstein, hebben onthullingen in zijn e-mails en andere bestanden geleid tot de ontslag van meerdere bedrijfsleiders, nieuwe onderzoeken in misbruik door Epstein en potentiële medeplichtigen, en zelfs de arrestatie van de voormalige prins Andrew van Groot-Brittannië.

Voor degenen die de enorme correspondentie en het netwerk van verbindingen van Epstein binnen de industrie, de overheid en de academische wereld willen onderzoeken: enkele van de meest effectieve tools zijn niet gebouwd door federale onderzoekers of grote nieuwsorganisaties, maar door een sjofel team van vrijwillige ontwikkelaars.

Te beginnen met een website genaamd Jmailwaardoor de openbaar gemaakte e-mails van Epstein doorzoekbaar werden via een interface die brutaal gekopieerd was van Gmail, hebben ze sindsdien een reeks webapps gebouwd die zijn gemodelleerd naar bekende sites als Google Drive, Wikipedia, Amazon en YouTube. Het doel: rommelige pdf’s en andere bestanden die in grote hoeveelheden door federale functionarissen worden vrijgegeven, omzetten in iets dat het publiek (inclusief journalisten) gemakkelijker kan doorzoeken en begrijpen.

De sleutel tot het snelle succes van het project is het technische talent van het team van ongeveer 15 genoemde kernbijdragers. Maar net zo belangrijk, zeggen ze, is de huidige golf van AI tools waarmee ze snel code konden genereren en enorme hoeveelheden gegevens konden verwerken.

“We hebben dus niet alleen een app die we heel snel hebben kunnen maken, we beschikken ook over gegevens waarmee we die app kunnen vullen met echte inhoud”, zegt Luke Igel, een van de eerste makers van het project. “Beide dingen moesten samenkomen; beide waren een paar jaar geleden niet mogelijk.”

Igel, afgestudeerd aan MIT en medeoprichter en CEO van een videosoftwarebedrijf Kwaadaardigzegt dat de inspiratie voor het project kwam nadat hij en een vriend een eerste tranche van Epstein-gerelateerde documenten bespraken vrijgegeven door leden van het Congres in november. Ze werden getroffen door de omvang van Epsteins banden met politieke figuren over de partijgrenzen heen en over de hele wereld heen, maar vroegen zich af of het publiek het verhaal volledig zou kunnen begrijpen zoals de gegevens aanvankelijk werden gepresenteerd.

Igel nam toen contact op Riley Walzeen ontwikkelaar en ondernemer die bekend staat om creatieve internetprojecten (waaronder a recente parodie van Apple’s ‘Find My’-interface die parkeerwachters in San Francisco volgde) over het verzamelen van de e-mails in een Gmail-achtige interface.

Dankzij AI-ontwikkeltools zoals Cursor en de Claude-modellen van Anthropic kon het tweetal binnen een paar uur de eerste versie van Jmail samenstellen, zegt Igel. “We hebben Gmail gekloond, behalve dat je bent ingelogd als Epstein en zijn e-mails kunt zien”, Walz kondigde dit in november aan in een virale X-post.

Toen het ministerie van Justitie in december een extra reeks dossiers vrijgaf, onder impuls van de Epstein dient de Transparantiewet in die vorige maand door het Congres werd aangenomen, verzamelde een groep van ongeveer tien medewerkers zich in het huis van Igel in San Francisco en via een videoconferentie om de volgende versie van de software te bouwen.

Het team kreeg ook hulp van een bedrijf genaamd Redoute– een maker van software die rommelige pdf’s en andere complexe documenten omzet in gestructureerde gegevens – om de nieuw vrijgegeven bestanden te parseren, die te complex waren geworden voor algemene AI-tools om betrouwbaar te ontcijferen.

“Veel van deze pdf’s zijn scans van afdrukken of handschriften”, zegt Adel Wu, die bij Reducto aan groei werkt. “Het was eigenlijk heel rommelig.”

Het bedrijf – dat in hetzelfde gebouw is gevestigd als Kino – had al overwogen iets met de Epstein-bestanden te doen en besloot snel de Jmail-inspanning te steunen nadat het erover hoorde, zegt oprichter Omar Alhait, en merkte op: “We hebben heel snel alle documenten doorgenomen en alle relevante e-mailinformatie daaruit ontleed.”

De software van Reducto hielp de redacties binnen de documenten nauwkeurig weer te geven en liet het team zelfs complexe informatie extraheren, zoals de vluchtgegevens van Epstein, die beschikbaar werden gesteld in een interface in Google Flights-stijl genaamd JVluchten. Nogmaals, AI, inclusief die van Anthropic het toenmalige nieuwe Claude Opus 4.5-model– hielp het Jmail-team snel nieuwe functies en apps te ontwikkelen en duizenden code-updates in korte tijd samen te voegen.

“Veel van wat ik dacht dat de kern was van software-engineering, is eigenlijk iets waar dit model je mee kan helpen en je er heel snel doorheen kan helpen”, zegt Igel.

Dankzij de investering van het team in de infrastructuur konden ze snel aanvullende documenten importeren, verwerken en delen die vlak voor Kerstmis waren vrijgegeven, hoewel het project zelfs nog meer aandacht trok na een massale DOJ-vrijgave van miljoenen Epstein-gerelateerde bestanden op 30 januari. Het afhandelen van die vrijgave vereiste niet alleen het verwerken van de nieuwe documenten – Alhait zegt dat het Reducto ongeveer drie dagen kostte om de gegevens door te nemen – maar ook het versterken van de infrastructuur van het project om de toestroom van verkeer aan te kunnen, omdat de publieke belangstelling voor de bestanden bleef groeien.

“Er kwamen weer heel veel mensen naar het huis, en deze keer moesten we het echt opschalen”, zegt Igel. “Alles ging kapot. Talloze schaalproblemen waarvan we dachten dat we ze hadden opgelost, zoals databasestoringen en falende caching, kwamen opnieuw naar voren.”

Met behulp van AI-tools heeft het team de site gestabiliseerd, die nu meer dan 500 miljoen paginaverzoeken heeft ontvangen voor meer dan 50 miljoen unieke bezoekers. Het project is ook uitgebreid tot buiten Jmail en J Flights en omvat een AI-gids voor de bestanden genaamd Jemini, een videorepository genaamd JeffTube, een bestandsrepository bekend als JDrive, en zelfs een doorzoekbaar logboek van Epsteins Amazon-bestellingen genaamd Jamazon.

Het team zorgt ervoor dat de informatie in de bestanden op de juiste manier wordt geredigeerd om gevoelige details te beschermen, en zorgt ervoor dat het beschikbare materiaal van de site wordt bijgewerkt om eventuele nieuwe redacties door federale functionarissen weer te geven. “Het is heel erg belangrijk voor ons om zo verantwoordelijk mogelijk te zijn bij het openbaar maken van informatie”, zegt Melissa Du, een AI-onderzoeksingenieur die aan het project werkt. “We willen uiteraard niet overdrijven, maar ook de privacy van de slachtoffers is van het allergrootste belang.”

Du, ook afgestudeerd aan het MIT, zegt dat ze ‘morbide gefascineerd’ raakte door de eerste reeks bestanden die op Jmail werden vrijgegeven, inclusief documenten die verwijzen naar aan het MIT verbonden academici zoals voormalig Media Lab-directeur Joi Ito en emeritus hoogleraar Noam Chomsky. Sindsdien heeft ze gewerkt aan aspecten van het project, zoals JDrive voor databeheer en de Jwiki in Wikipedia-stijldie eerst werd gevuld met beschrijvingen van belangrijke aan Epstein gekoppelde cijfers gegenereerd door AI en vervolgens zorgvuldig doorgelicht vóór publicatie.

Misschien wel het meest opvallende aan het project is dat een kleine groep ontwikkelaars in staat was te doen wat grote mediaorganisaties hadden gedaan bij het organiseren van eerdere opslagplaatsen voor virale gegevens, zoals de voormalige inlichtingencontractant Edward Snowden. onthullingen over overheidstoezicht of de offshore financiële lekken bekend als de Panama Papers.

Het team heeft ontvangen ongeveer $ 32.000 aan donaties om verschillende kosten te dekken, samen met gedoneerde technische diensten van Reducto, Kino en cloudprovider Vercel. Maar het kernwerk wordt gedaan door ontwikkelaars met hun eigen baan en startups.

Hoewel Igel zich af en toe afvroeg of het project effectief zou worden opgepikt door grote nieuwsorganisaties die hun eigen Epstein-dataverkenners bouwen, zijn gegevens uit het Jmail-project daadwerkelijk geciteerd door nieuwsuitzendingen, waaronder De Econoom. Het team heeft ook contact gehad met stafmedewerkers van het Congres over het doorgeven van crowdsourced-verzoeken voor vrijgave van mogelijk overdreven geredigeerde bestanden.

En er worden aanvullende functies overwogen, waaronder een interface in Google Agenda-stijl om agendagegevens in de repository te verkennen, zegt Igel, die opmerkt dat de onderliggende code van het project in de toekomst waarschijnlijk ook als open source zal worden vrijgegeven.

Het project is nu al een voorbeeld van wat mogelijk is voor een getalenteerd team dat is uitgerust met de nieuwste tools voor AI-ontwikkeling en gegevensverwerking. “We hebben echt vertrouwd op de nieuwe AI-modellen”, zegt Du. “En we hadden ook een zeer hoog niveau van vertrouwen binnen het team.”


Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in