Home Nieuws Dankzij AI-stemdictatie spreken meer mensen hun e-mails, berichten en code uit

Dankzij AI-stemdictatie spreken meer mensen hun e-mails, berichten en code uit

2
0
Dankzij AI-stemdictatie spreken meer mensen hun e-mails, berichten en code uit

Gavin McNamara heeft zijn toetsenbord verlaten en brengt de hele dag door met praten in plaats van typen.

Hij spreekt urenlang met zijn computer en telefoon, verzendt e-mails, schrijft presentaties, post op LinkedIn en codeert zelfs gesprekken met behulp van een AI-dicteerapp van de startup uit San Francisco, Wispr Flow.

De AI interpuncteert, formatteert en past zijn omzwervingen aan tot een samenhangende kopie. McNamara haalt gemiddeld 125 woorden per minuut, wat twee keer de gemiddelde typsnelheid is.

“Op dit moment doe ik alles wat gedaan kan worden door te typen, door te spreken”, zegt de 32-jarige oprichter van softwarebureau Why Not Us. ‘Ik praat alleen maar.’

In 77 apps heeft hij de afgelopen vijf maanden bijna 300.000 woorden gedicteerd – dat staat gelijk aan het schrijven van drie romans.

De tech-titanen en startups uit Californië lopen voorop in een beweging om AI en de grote taalmodellen waarop ze zijn gebaseerd te gebruiken om mensen ertoe aan te zetten met technologie te communiceren met behulp van hun stem in plaats van hun vingers.

“AI en LLM’s hebben de dynamiek veranderd”, zegt CJ Pais, de in San Diego gevestigde maker van de gratis spraak-naar-tekst-dicteerapp Handy. “Je stem gebruiken gaat veel sneller dan typen.”

Er is een mix van onafhankelijke ontwikkelaars en startups ontstaan, waaronder Handy, Wispr Flow en Willow uit San Fransico en anderen, om nauwkeurige steminteractie met kunstmatige intelligentie te bieden.

De grootste namen in de technologiewereld creëren ook nieuwe manieren waarop mensen met AI kunnen samenwerken. De nieuwste slimme bril van Meta is afhankelijk van stem. OpenAI en Meta hebben verschillende persoonlijkheden ontworpen voor de voicechats van hun bots. Zelfs Amazon’s Alexa en Apple’s Siri ondergaan AI-upgrades, waarvan de bedrijven verwachten dat iedereen veel meer met hun technologie zal praten.

Deze gratis en betaalde methoden voor het gebruik van gesproken woorden met computers hebben miljoenen gebruikers aangetrokken, waaronder codeerders, uitvoerend assistenten, advocaten, makers van inhoud en artsen. Sommige optimisten denken dat het toetsenbord verouderd kan raken.

“Ik ben verheugd om aan te kondigen dat we toetsenborden hebben verwijderd van de meest prestigieuze televisieprijzen ter wereld”, zei Allan Guo, de oprichter van Willow, in een bericht op LinkedInwaarbij hij opmerkte dat het Emmy Awards-team het stemdictaat van Willow gebruikte om Slack-berichten te verzenden en de inbox sneller leeg te maken ter voorbereiding op de prijzen van 2026.

Door de jaren heen hebben grote technologiebedrijven dat wel gedaan aangepast veel van hun producten zijn voorzien van voice-first-functies – voor het gemak. De huidige draai van stem als toegankelijkheidsfunctie naar een productiviteitstool.

Eind 2022 kwam de maker van ChatGPT begon onbelemmerde toegang weg te geven naar zijn automatische spraakherkenningsmodel genaamd Whisper, getraind op 680.000 uur aan meertalige gegevens. OpenAI deelde de technologie voor nauwkeurige audiotranscriptie, ooit een goed bewaard groot technisch geheim. Iedereen kon nu gratis AI-transcriptie van hoge kwaliteit downloaden en uitvoeren op hun laptop.

De nieuwe golf AI-dicteerapps gebruikt Whisper als basis en bouwt daarop voort om live dicteren aan te bieden. Hoewel er gratis alternatieven zijn, kost een betaald abonnement tussen de $ 8 en $ 12 per maand.

Door AI aangedreven dicteren krijgt nu steeds meer voet aan de grond onder programmeurs en gewone gebruikers – en zorgt ervoor dat mensen tegen hun laptops praten. Of het nu gaat om het schrijven van e-mails, het verzenden van sms-berichten, het ontwerpen van een website of het geven van AI-taken: early adopters zeggen dat dicteren hen in staat stelt sneller te werken, helderder te denken en productiever te zijn.

“De mensen die de stem sterk hebben geadopteerd, gaan niet meer terug. Als je eenmaal twintig uur per week tegen je laptop praat, voelt typen als wrijving”, zegt Naveen Naidu, algemeen directeur van de in New York gevestigde spraakdictatie-app Monologue. “Waar het volgens mij naartoe gaat: stem wordt de delegatielaag. Jij spreekt je intentie uit en er gebeuren dingen.”

Deze nieuwe AI-dicteerapps maken gebruik van die van Apple geavanceerde chips op iPhones en Macs om privédictaten op het apparaat uit te voeren.

Geoffrey Huntley, een onafhankelijke softwareontwikkelaar, schakelde in juni vrijwel volledig over op voice for work.

Hij start projecten vaak door een stemprompt te openen en de AI te vragen hem te interviewen over zijn zorgen en projectvereisten voordat er code wordt gegenereerd.

“Ik praat er tegen, alsof ik in een jazzband aan het riffs ben, achteruit, vooruit, achteruit, vooruit”, zei Huntley. Deze vocale dans helpt de specificaties te verfijnen, waarna de AI het stuur overneemt, en bouwt software.

Naast coderen gebruikt Huntley stem om ‘het te laten scheuren’ bij het vastleggen van blogpostideeën of berichten, met behulp van apps zoals Superfluisteren of Whisper Flow om een ​​“eerste dump” van gedachten te krijgen voordat u naar een toetsenbord gaat voor de definitieve bewerking.

Een groeiend aantal softwareontwikkelaars in Silicon Valley dicteert urenlang codeerinstructies in plaats van te typen. De combinatie van snel voortschrijdende AI-agenten waarvoor kan worden gecodeerd uurwaarbij spraakinvoer gedachten sneller vastlegt dan typen, heeft hun productiviteit verhoogd.

De zelfbenoemde ‘vibe coder’ McNamara bouwde in een paar maanden tijd meer dan 25 webapps, een ontwikkelingssnelheid die onmogelijk zou zijn zonder gesproken instructies.

“Ik denk op geen enkele manier dat (typen) zelfs maar efficiënt of effectief zou zijn om daar zo snel te komen als met praten”, zei McNamara.

Hij gebruikte een kronkelend gesprek en een paar uur om AI te laten bouwen Spruit geschenkeneen cadeaulijst voor kinderen en een app voor Beoordeel eventuele items via foto’s.

Zeker, AI kan fouten maken en het werk ervan moet worden gecontroleerd.

Ondertussen heeft de brede acceptatie nieuwe ongemakken met zich meegebracht, omdat zelfs ervaren gebruikers zich ongemakkelijk voelen bij het praten tegen hun laptops. Drukke open kantoren zijn er niet voor bedoeld dat veel mensen tegelijkertijd met hun computers praten.

“Liefdesstem, maar niet in een kantooromgeving”, zei er een gebruiker over X. “Ik hou er niet van om met andere mensen te praten. Ik zou het in een kantoor met gesloten deuren doen, of in mijn auto gaan werken.”

McNamara gebruikt een koptelefoon, zodat mensen aannemen dat hij aan het bellen is.

“Het lijkt op de sociale hack die ik heb”, zei hij.

Hoewel het nog te vroeg is om te zeggen of en wanneer het Qwerty-toetsenbord de tickertape- en faxmachines zal volgen in veroudering, neemt de snelheid richting stem toe, zegt Dylan Fox, oprichter van het in San Francisco gevestigde Assembly AI, dat audiomodellen aan bedrijven aanbiedt.

“We staan ​​zeker aan het begin van wat wij zien als deze 10 tot 100x toename van de vraag naar spraak, AI-applicaties en interfaces”, zei hij.

Voor de programmeur McNamara heeft het meer praten met chatbots hem tot een betere vriend gemaakt.

Hij was vroeger slecht in het reageren op sms-berichten. Nu keert hij meteen terug naar vrienden.

“Ik reageer zo snel, ze zeggen: ‘Wie is deze man?'”, zei hij.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in