Als ik door mensen in New York zigzag, kan ik niet naar mijn telefoon staren om te sms’en. Spraak-naar-tekst-hulpmiddelen zijn cruciaal geworden voor snelle communicatie tijdens het dubbelvuisten smartphone en een Jamaicaans rundvleespasteitje.
Het probleem is dat het systeem soms woorden verkeerd interpreteert, interpunctie mist of de opname helemaal stopt. Dit zorgt ervoor dat ik midden in het voetgangersverkeer stop, waar ik terug moet gaan en moet beginnen met bewerken, waarbij ik alle gemakken van spraak-naar-tekst moet elimineren. Eerlijk gezegd zou dit opgelost moeten kunnen worden met AI, de technologie die onze manier van werken op zijn kop zet winkel, surfen op internet En lees over het overlijden van onze dierbarenten goede of ten kwade.
Er is enige vooruitgang. Google geïntroduceerd geavanceerd spraaktypen eerder dit jaar voor bezitters van de Pixel 6 en nieuwere apparaten. Eenmaal ingeschakeld, kun je teksten daadwerkelijk met je stem bewerken, en de ingebouwde AI kan teruggaan en verkeerd gesproken woorden corrigeren. Als u bijvoorbeeld ‘laatste woord verwijderen’ zegt, wordt het laatste woord verwijderd en als u ‘wissen’ zegt, wordt de laatste zin gewist. Als je Pixel 8-bezitters en hoger zegt: ‘repareer het’, krijg je suggesties om je sms-berichten te verbeteren, met eenvoudige tikken om je berichten op te schonen. Degenen met nieuwere Pixel-handsets kunnen hun apparaat ook via spraak vertellen om woorden te herschikken of te vervangen. Pixeleigenaren kunnen de AI zelfs leren de spelling van namen te veranderen, zoals het veranderen van Christine in Christyne. Pixel 9- en 10-bezitters (exclusief de Pixel 9A, wat vreemd is omdat beide hebben dezelfde processor en RAM) kunnen de AI gebruiken om berichten te proeflezen, opnieuw te formuleren of te formaliseren.
Het kan even duren om alle nieuwe functies te leren kennen. Maar als het eenmaal ingebakken is, is het gebruik van spraak-naar-tekst minder omslachtig. Maar het werkt niet perfect en er is ruimte voor verbetering.
Hoewel Pixel-apparaten geen geavanceerde processors of camera’s met de hoogste megapixels hebben, onderscheidt Google zich van concurrenten als Samsung en Motorola met zijn krachtige software-ondersteuning, die alleen maar verder wordt ondersteund door AI. Interessant genoeg is de verkoop van Pixel dat wel groeit snelToch wil het bedrijf niet noodzakelijkerwijs de nabije omgeving domineren Smartphonemarkt van $600 miljard. Google gaf dit toe in een interview met Bloomberg eerder dit jaar. In plaats daarvan concentreert de kernstrategie van Google zich nu rond AI. Of het nu Apple of Samsung is, beide zullen (naar verluidt) Google Gemini gebruiken.
Ondanks dat Pixel-telefoons te weinig kracht hebben en rekening houdend met de macht van Google in de AI-race, moet het bedrijf uitzoeken hoe AI-aangedreven spraak-naar-tekst kan werken om de mogelijkheden van zijn technologie te laten zien, waar Google nog niet helemaal klaar voor is. Dat betekent dat het aan Google is om aan de rest van de industrie te laten zien dat zijn AI-oplossingen op mobiel de beste zijn, en zijn Pixel-telefoons laten die ontwikkeling zien. Hier ziet u hoe het voor u kan werken.
Als geavanceerd spraakgestuurd typen werkt, is het geweldig
Het is cool om te zien hoe de AI van Google woorden vervangt of verandert met je stem. Het is niet zo veel om te zien dat het de opdracht uittypt die ik hem gaf in plaats van de opdracht uit te voeren.
Dat is wat ervoor zorgt dat geavanceerd stemtypen als een rotzooi voelt. Als het werkt, is het geweldig. Maar het aantal keren dat de AI moeite heeft om onderscheid te maken tussen woorden die bedoeld zijn voor berichtenuitwisseling en woorden die moeten worden gerepareerd, is talrijk.
Deze willekeur is bizar omdat Google’s Gemini-app op mijn Pixel 10 Pro-vouw review unit lijkt mij prima te begrijpen. Volgens Google komt het verschil doordat de telefoon transcriptie op het apparaat uitvoert, wat betekent dat er een kleiner lokaal AI-model wordt uitgevoerd. Het is duidelijk dat een klein AI-model op een telefoon niet kan concurreren met een datacenter van meerdere miljarden dollars dat wordt gebruikt voor cloudgebaseerde modellen. Google zegt dat het regelmatig verbeteringen vrijgeeft.
Ontbrekende leestekens zijn een heel gedoe
Ik had moeite met interpunctie op oudere voice-to-text-systemen, waarbij ik de woorden ‘komma’, ‘uitroepteken’ en ‘punt’ hardop moest uitspreken. Met geavanceerd spraakgestuurd typen gaat het automatisch. Maar zelfs deze functie kan onregelmatig zijn.
Als het werkt, is het een groot gemak, omdat ik niet terug hoef te gaan naar het sms-bericht en interpunctie hoef toe te voegen. Als het echter niet werkt, ontstaat er één lange, moeilijk leesbare, doorlopende zin die frustrerend is om te volgen en die mij onzorgvuldig doet overkomen.
Als Google het bij het juiste eind heeft, kan dit een gamechanger zijn
Consumenten zijn geweest verbijsterd door de golf van AI-functies die hun telefoons doordringen. Natuurlijk zijn snelle fotobewerkingen of het herschrijven van e-mails handig, maar vaak voelen deze functies eerder aanvullend dan transformerend aan.
Ik heb het gevoel dat consumenten, als ze aan AI denken, vaak denken aan TARS uit de film Interstellar uit 2014, of aan HAL 9000 uit 2001: A Space Odyssey uit 1968. Vaak zijn de AI-systemen waarmee we op onze telefoons communiceren gewoon geavanceerdere manieren om te doen wat onze apparaten al op andere manieren hebben gedaan.
Om ervoor te zorgen dat Google geavanceerd spraakgestuurd typen goed kan uitvoeren, moeten de modellen de intentie naadloos kunnen onderscheiden van het dictaat. Er kan niet sprake zijn van voortdurend jongleren waar het de helft van de tijd werkt. Voor de meesten zal het alleen maar vervelend zijn. Voor mij eindigt het met een culinair gedoe en een door ratten onderschept rundvleespasteitje.
Hoe je geavanceerd spraakgestuurd typen inschakelt op Pixel
- Ga naar de Berichten-app.
- Klik op een contact alsof u op het punt staat te beginnen met sms’en.
- Tik op het pictogram dat eruitziet als vier vierkanten in de linkerhoek van het toetsenbord.
- Kraan Instellingen.
- Tik op Spraaktypen.
- Draai Geavanceerde functies voor spraaktypen op.
Spraakopdrachten (Pixel 6 en hoger)
- Om het laatste woord te verwijderen, zegt u: “Verwijder laatste woord.”
- Om de laatste zin te verwijderen, zegt u: ‘Wissen’.
- Om de tekst te wissen, zegt u: ‘Wis alles’.
- Als u een bericht wilt verzenden, zegt u: ‘Verzenden’.
- Als u het volgende open veld in een formulier wilt invullen, zegt u: ‘Volgende’.
- Als u een emoji wilt toevoegen, zegt u de naam van de emoji, bijvoorbeeld ‘Smiley-emoji’.
- Als u het typen met spraak wilt stoppen, zegt u: ‘Stop’.
‘Fix it’ gebruiken (Pixel 8 en hoger, alleen Engels, VS)
- Nadat u een tekst hebt gedicteerd, zegt u: ‘Repareer het’.
- Er zou een pop-up moeten verschijnen met suggesties.
- Deze functie werkt mogelijk niet voor iedereen.
Gebruik AI voor gedetailleerde bewerkingen, proeflezen en herschrijven (Pixel 8 en hoger, alleen in de VS)
- Zeg een van de onderstaande opdrachten.
- Het zou automatisch moeten zijn, maar het kan zijn dat u een Toepassen knop.
- Na bewerkingen kunt u ook ‘Ongedaan maken’ zeggen om de opdracht ongedaan te maken.
- Verwijder het hele bericht door ‘Wis alles’ te zeggen.
- De functie is experimenteel en werkt mogelijk niet altijd.
Commando’s:
Geavanceerde spraaktypeopdrachten voor Google Pixel-apparaten.


