Home Nieuws Ik heb een ‘digitale tweeling’ van mezelf gekloond met AI. Hij is...

Ik heb een ‘digitale tweeling’ van mezelf gekloond met AI. Hij is overtuigend genoeg om mijn moeder voor de gek te houden

1
0
Ik heb een ‘digitale tweeling’ van mezelf gekloond met AI. Hij is overtuigend genoeg om mijn moeder voor de gek te houden

Ik ben geboren als enig kind, maar nu Ik heb een tweeling. Hij is een exacte kopie van mij– tot aan mijn kleding, mijn huis, mijn gezichtsuitdrukkingen en zelfs mijn stem.

Ik heb hem mee gebouwd AIen ik kan hem laten zeggen wat ik wil. Hij is zo overtuigend dat hij mijn eigen moeder voor de gek zou kunnen houden.

Hier is hoe ik hem heb gebouwd– en wat AI digitale tweelingen betekenen voor de toekomst van mensen.

Deepfake jezelf

Vanaf het moment dat generatieve AI werd geboren, begonnen criminelen het te gebruiken om mensen te misleiden.

Deepfakes waren een van de eerste wijdverbreide toepassingen van de technologie. Tegenwoordig zijn ze een plaag voor beroemdheden en zelfs voor beroemdheden alledaagse tienersen een enorm probleem voor iedereen die geïnteresseerd is in de waarheid.

Terwijl criminelen deepfakes gebruikten om mensen op te lichten en te chanteren, begon een aantal white-hat-bedrijven stilletjes vergelijkbare digitale kloontechnologieën voorgoed te gebruiken.

Wilt u een trainingsvideo opnemen voor uw team en vervolgens een paar woorden veranderen zonder dat u de hele film opnieuw hoeft te filmen? Wilt u uw 400 pagina’s omslaan? Vreemdere dingen fanfic omzetten in een audioboek zonder 10 uur van je leven te besteden aan het voorlezen ervan?

Digitale kloontechnologie heeft u gedekt. In feite deepfake je jezelf – door je beeltenis, je stem of beide te klonen – en mobiliseer je vervolgens de resulterende “digitale tweeling” om bergen inhoud te creëren, net zo gemakkelijk als je ChatGPT of Claude zou vragen.

Ik wilde de technologie zelf uitproberen. Dus heb ik de beste AI-kloontools van dit moment geactiveerd en Digital Tom gemaakt: een perfecte digitale kopie van mezelf.

Luister naar mij

Ik besloot te beginnen met het klonen van mijn stem. De stem van een persoon voelt als een bijzonder intiem, persoonlijk iets.

Denk eens terug aan een dierbare die je verloren hebt. Ik wed dat je je nog precies kunt herinneren hoe ze klonken. U kunt zich waarschijnlijk zelfs een specifiek, impactvol gesprek herinneren dat u met hen had.

Het klonen van een stem – met alle nuances van accent, spreekstijl, toonhoogte en adem – is dat ook een zware technische uitdaging. Mensen vergeven snel waardeloze video, fouten of glitches in deepfakes toeschrijven aan een slechte internetverbinding of een oude webcam. Contentmakers overal ter wereld produceren elke dag slechte video zonder enige hulp van AI!

Een slechte AI-stem klinkt echter veel griezeliger. Het is gemakkelijker om in de griezelige vallei te belanden, tenzij elk aspect van een stemkloon perfect is.

Om dat lot te vermijden, wendde ik me tot ElfLabs. Het bedrijf bestaat sinds 2022, maar is het afgelopen jaar enorm in populariteit gestegen de waardering verdubbelt tot ruim $6,6 miljard.

ElevenLabs blinkt uit in het omgaan met audio. Als je naar een door AI verteld audioboek hebt geluisterd, interactie hebt gehad met een sprekend personage in een videogame of geluidseffecten hebt gehoord in een tv-programma of film, is de kans groot dat je per ongeluk de technologie van ElevenLabs hebt ervaren.

Om mijn eigen stem te klonen, heb ik $ 22 uitgegeven voor een Creator-account. Vervolgens heb ik ongeveer 90 minuten aan opnames van mijn YouTube-kanaal geüpload naar de ElevenLabs-interface.

Het bedrijf zegt dat je een professionele stemkloon kunt maken met slechts 30 minuten audio. U kunt zelfs een basiskloon maken met slechts 10 seconden spraak. ElevenLabs laat je een toestemmingsclip opnemen om ervoor te zorgen dat je niet probeert een derde partij te deepfaken.

Binnen een paar uur was mijn professionele stemkloon klaar. Het gebruik ervan is verrassend eenvoudig. ElevenLabs biedt een interface die veel op ChatGPT lijkt. U voert in wat u wilt dat uw kloon zegt, drukt op een knop en binnen enkele seconden spreekt uw digitale tweelingstem precies de woorden die u hebt getypt.

Ik had mijn digitale tweeling een audio-update over dit artikel laten opnemen voor mij Snel bedrijf editor. Hij omschreef het als ‘angstaanjagend realistisch’. Vervolgens stuurde ik een fragment naar mijn moeder. Ze antwoordde: “Het zou mij voor de gek hebben gehouden.”

In mijn natuurlijke habitat

Ik was enorm onder de indruk van de stemkloon. Ik zou het meteen kunnen gebruiken om een ​​hele door AI gegenereerde podcast op te zetten, mijn vrienden voor de gek te houden, of misschien zelfs hack mijn bank.

Maar ik wilde niet alleen een stem. Ik wilde een volledige digitale tom die ik naar mijn hand kon zetten.

Voor de volgende fase in mijn kloonexperiment wendde ik me tot Synthesie. Ik ontmoette de CEO van Synthesia, Victor Riparbelli, voor het eerst in 2019 tijdens een evenement in de foto-industrie, toen zijn bedrijf nog een slordige startup was. Vandaag is het zo ter waarde van 4 miljard dollar.

Synthesia is gespecialiseerd in het creëren van digitale ‘Avatars’ – in wezen videoklonen van een echte persoon. Net als bij ElevenLabs kun je tekst in een interface typen en een video terugkrijgen waarin je avatar deze voorleest, compleet met realistische gezichtsuitdrukkingen en lipbewegingen.

Ik startte een proefaccount voor Synthesia en begon mijn persoonlijke avatar te maken. Synthesia vroeg om toegang tot mijn webcam en nam vervolgens op dat ik gedurende ongeveer 10 minuten een vooraf ingesteld script van het scherm las.

Een dag later was mijn avatar klaar. Het was een perfecte digitale kloon van mijn beeltenis, tot aan het shirt dat ik droeg op de dag dat ik het maakte en mijn (te lange) winterkapsel. Het plaatste me zelfs in mijn natuurlijke habitat: mijn comfortabele, rommelige thuiskantoor.

Net als bij mijn stemkloon kon ik elke tekst typen die ik maar kon bedenken, en binnen ongeveer 10 minuten ontving ik een video waarin Digital Tom deze voorlas.

Synthesia dupliceerde zelfs de details van mijn presentatiestijl, tot aan mijn glimlach en de neiging om elke paar seconden naar de camera te kijken wanneer ik een script van het scherm lees.

Als ik met Digital Tom een ​​video zou opnemen voor mijn YouTube-kanaal, weet ik zeker dat de meeste gebruikers geen idee zouden hebben dat het nep is.

De waarde van mensen

Mijn experiment laat zien dat de huidige AI-kloontechnologie buitengewoon indrukwekkend is. Ik zou gemakkelijk bergen audiocontent kunnen creëren met mijn kloon van ElevenLabs, of een heel socialemediakanaal kunnen creëren met mijn Digital Tom als ster.

De grotere vraag is echter waarom ik dat zou willen.

Natuurlijk zijn er talloze goede gebruiksscenario’s om mee te werken A digitale tweeling.

Ook hier is Synthesia gespecialiseerd in het maken van bedrijfstrainingsvideo’s. Bedrijven kunnen snel gespecialiseerd lesmateriaal maken zonder een studio te huren, inhuren een videograaf, en talloze opnames maken van een pratend hoofd voor een groen scherm.

Ze kunnen ze ook bewerken door een paar geschreven woorden te wijzigen, bijvoorbeeld als een productkenmerk subtiel verandert.

ElevenLabs doet op zijn beurt goede zaken op het gebied van audioboeken en klantenservicemedewerkers. Maar ze bieden ook nuttige diensten, zoals creëren toegankelijke, voorgelezen versies van webpagina’s voor visueel gehandicapte gebruikers.

Maar mijn experiment overtuigde mij ervan dat er minder goede redenen zijn om mee te werken jouw digitale tweeling.

In een internetlandschap waar iedereen binnen een paar minuten een website van duizend pagina’s kan opstarten met behulp van Gemini, en meeslepende video’s zijn dankzij Sora dertien in een dozijninhoud is goedkoop. Er zijn niet veel goede manieren meer waarop gebruikers het kaf van het koren kunnen scheiden.

Persoonlijkheid is een van de weinige overgeblevenen. Mensen volgen graag mensen. Voor makers is het ontwikkelen van een persoonlijke relatie met je publiek de beste manier om ervoor te zorgen dat ze je inhoud blijven consumeren, in plaats van goedkopere (en vaak betere) AI-alternatieven.

Een compromis sluiten door een geheime digitale tweeling in hun gezicht te duwen, hoe overtuigend het ook mag zijn, lijkt de snelst mogelijke manier om die relatie te ruïneren.

Mensen willen iets horen van de op vlees gebaseerde Thomas Smith, zelfs als de kunstmatige intelligentie-versie nooit een woord vergeet wordt halverwege de video onderbroken door zijn kippen.

Ik zou een van de ingebouwde karakters van ElevenLab of Synthesia kunnen gebruiken om (volledig openbaar gemaakte) inhoud te creëren. Maar ik zie het niet zitten om mijn digitale tweeling in de echte wereld te gebruiken.

Ik zie echter één gebruik voor de technologie. Tijdens mijn experiment viel het mij op dat de beste reden om een ​​AI digital twin te bouwen niet is om je stem of gelijkenis te vervangen, maar om deze te behouden.

Soms verlies ik mijn stem, en het is ongelooflijk storend voor mijn inhoudproductie. Als ik ooit last heb gehad van een stemstoornis en deze definitief kwijtraak, is het fijn om te weten dat er een zeer realistische back-up op de servers van ElevenLabs staat.

Het is ook gaaf om te bedenken dat ik over tien jaar – als ik onvermijdelijk ouder en rimpeliger ben dan vandaag – mijn Digitale Tom uit 2026 weer tot leven zou kunnen brengen. Hij zou bevroren zijn in de tijd, een perfecte replica van mijn uiterlijk, maniertjes en omgeving op dit specifieke moment, voor altijd herinnerbaar.

Ik zal Digital Tom niet snel gebruiken om mijn YouTube-kanaal uit te breiden, te beginnen met podcasten of mijn kinderen een verhaaltje voor te lezen voor het slapengaan. Maar er is een vreemd deel van mij dat blij is dat hij er is, voor het geval dat.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in