Home Nieuws Deze AI-aangedreven machine verandert foto’s in geuren

Deze AI-aangedreven machine verandert foto’s in geuren

2
0
Deze AI-aangedreven machine verandert foto’s in geuren

Stel je een herinnering uit je kindertijd voor, een herinnering die echt en nostalgisch aanvoelt, maar op de een of andere manier gewoon ongrijpbaar is: misschien een familie-uitje naar het strand, of even schommelen op de speelset, of een middagje op jacht naar klavertje vier. Stel je nu eens voor dat je dat gouden moment in een geur zou kunnen stoppen.

Eén wetenschapper bij METCyrus Clarke, werkt eraan om precies dat te doen. Samen met een team van collega-onderzoekers heeft Clarke een fysieke machine ontwikkeld, genaamd het Anemoia-apparaatdie gebruik maakt van een generatief AI-model om een ​​archieffoto te analyseren, deze in een korte zin te beschrijven en, na de eigen input van de gebruiker, die beschrijving om te zetten in een unieke geur.

Het woord “anemoia” was bedacht door auteur John Koenig en opgenomen in zijn boek uit 2021, Het woordenboek van duistere smarten. Het verwijst naar een specifiek gevoel van nostalgie naar een tijd of plaats die je zelf nooit hebt ervaren – en het is precies wat het team van Clarke hoopt vast te leggen met het Anemoia Device.

Volgens een papier Het apparaat, gepubliceerd door het team, onderzoekt het concept van ‘uitgebreid geheugen’, of het idee dat geheugen in het digitale tijdperk steeds vaker wordt opgeslagen en toegankelijk wordt gemaakt via externe media, zoals digitale archieven.

Studies hebben dit al aangetoond die herinnering kan plaatsvervangend worden gevormd – zoals wanneer een verhaal uit de tweede hand, misschien van een ouder, de eigen herinneringen vormgeeft – maar het Anemoia-apparaat is een heerlijk fysiek, interactief experiment over hoe AI kunnen gebruikers in staat stellen een herinnering te ervaren aan een verleden waarin ze nooit echt hebben geleefd.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Het Anemoia-apparaat

Het Anemoia-apparaat ziet eruit als iets dat je zou kunnen vinden in de medische ruimte van een retro sci-fi ruimteschip. Het is een slank apparaat van metaal en plastic, geaccentueerd met een uniek neongroen scherm en een eenvoudige reeks van drie fysieke wijzerplaten. Onderaan wacht een glazen beker om de laatste geur op te vangen.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Om te beginnen plaatst een gebruiker een foto in het apparaat. Een ingebouwd vision-taalmodel (VLM) analyseert de afbeelding en genereert een eerste bijschrift op basis van wat het vindt. Voor een foto van toeristen in China, een voorbeeld dat in de krant wordt gebruikt, zou het apparaat kunnen schrijven: ‘Een toerist in zwarte korte broek en een kind poseert in de deuropening langs de Grote Muur van China, met de iconische stenen trappen en het bergachtige landschap dat zich uitstrekt tot aan de hemel.’

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Gebruikers kunnen vervolgens de parameters van het bijschrift aanpassen met de drie draaiknoppen: één om te beslissen welke persoon of object in de afbeelding het onderwerp moet zijn; een tweede om de leeftijd van het onderwerp te beschrijven; en een derde om de sfeer van de scène te beschrijven.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

“Persoonlijk ben ik erg geïnteresseerd in het bedenken van nieuwe fysieke interfaces voor generatieve AI”, zegt Clarke. “Generatieve AI begint meestal met een blanco prompt. De draaiknoppen vervangen dat door een fysieke, gemakkelijk te begrijpen grammatica. Je probeert niet ‘het juiste te zeggen’ tegen een algoritme, het lijkt meer op het stemmen van een instrument.”

Een taalleermodel (LLM), opgebouwd op basis van ChatGPT-4o, verzamelt het originele bijschrift en de input van de gebruiker in een kort, poëtisch verhaal. Als je de Grote Muur van China zelf zou kiezen als onderwerp van de bovengenoemde prompt, zou het resultaat zoiets zijn als: ‘Eeuwenlang, van de Strijdende Staten tot de Ming, heb ik met vreugde de mars van de tijd en talloze reizigers op mijn pad van steen, baksteen en hout geobserveerd.’

Vervolgens komt de meest indrukwekkende taak van de LLM: het omzetten van dit geschreven gedicht in een tastbare geur.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Ruik als een geheugenportaal

Het geurontwikkelingsproces is niet alleen afhankelijk van het identificeren van de juiste geurnoten, maar ook van het oproepen van de juiste emoties.

Het team van Clarke trainde het model om te kiezen uit een geurbibliotheek van 39 verschillende geuren (sindsdien uitgebreid naar een breder portfolio van 50 geuren), variërend van oude boeken tot leer en vuil. Elke geur werd gecodeerd met een reeks descriptoren, waarbij ze werden voorzien van details zoals hun primaire noten, bijbehorende concepten en sterkste emoties. De LLM gebruikt zijn training om de juiste geuren te selecteren en te bepalen hoeveel van elk ervan in het uiteindelijke brouwsel moet worden gebruikt.

Al die informatie wordt naar een aangepast reukdisplay geleid, dat vier pompen gebruikt om de benodigde vloeistof uit hun flesjes te zuigen en in de wachtende beker te brengen (de uiteindelijke formule voor de geur van de Grote Muur van China omvat kampvuur, vuil, cederhout en bamboe). Het Anemoia-apparaat is in staat een vrijwel oneindig aantal geuren op te vangen de geur van een zandstrand op een warme zomerdag in de jaren ’80, naar de geur van een stel dat geniet van een peer in een schilderachtige tuin.

Uiteindelijk, zo concludeert de studie, is het apparaat een provocatie die de vraag stelt ‘wat het betekent om te onthouden wanneer de herinnering zelf kan worden gegenereerd, wat het betekent om te voelen als dat gevoel samen met een machine wordt gecreëerd, en wat het betekent om mens te zijn als we mooie, geurige ficties kunnen maken over een verleden dat we nog nooit hebben geleefd.’

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in