Home Nieuws Visueel imitatieleren: Guidde traint AI-agenten op menselijke ‘expertvideo’ in plaats van op...

Visueel imitatieleren: Guidde traint AI-agenten op menselijke ‘expertvideo’ in plaats van op documentatie

4
0
Visueel imitatieleren: Guidde traint AI-agenten op menselijke ‘expertvideo’ in plaats van op documentatie

Jarenlang is de ‘laatste kilometer’ van de digitale transformatie bezaaid met vergeten pdf’s en genegeerde trainingshandleidingen.

Organisaties geven miljoenen uit aan geavanceerde software zoals SAP of Salesforce, waarbij medewerkers moeite hebben met de basisnavigatie. Nu het tijdperk van agentische AI ​​aanbreekt, worden bedrijven geconfronteerd met een tweesnijdend zwaard: ze moeten menselijke werknemers leren samenwerken met AI, terwijl ze tegelijkertijd AI-agenten leren navigeren door de labyrintische interfaces van de moderne onderneming.

Eén idee dat steeds meer momentum lijkt te winnen onder AI-forward bedrijven: het gebruik van schermopnamen en tutorials/walkthroughs van iemand die een bedrijfstaak uitvoert (of het nu gaat om het maken van een nieuw ticket of het verwerken van een factuur) en het trainen van AI om de stroom te repliceren op basis van de schermopname. Deze week belde een startup Standard Intelligence ging viraal op X met een vroege demo van een open versie hiervan voor de fysieke en digitale wereld.

Maar de waarheid is dat er al spelers zijn die dit probleem voor de onderneming zelf aanpakken: case-in-point, Begeleideen Israëlische startup geboren tijdens de videocentrische jaren van de COVID-19-pandemie, heeft vandaag een overinschrijving van $50 miljoen in de Series B aangekondigd financieringsronde onder leiding van PSG Equity om precies deze kennisinfrastructuurcrisis aan te pakken.

In plaats van een agent een statische pdf-handleiding te geven, biedt Guidde high-fidelity “Video Ground Truth”: een rijke stroom gegevens verzameld door echte menselijke experts terwijl ze door complexe software navigeren.

De investering signaleert een verschuiving in de manier waarop de technologie-industrie documentatie beschouwt – niet als een statisch bijproduct van werk, maar als de kritische telemetrie die nodig is om de volgende generatie autonome digitale agenten te trainen.

Technologie: van video-opname tot wereldmodellen

In de kern is Guidde een AI Digital Adoption Platform (ADAP). De technologische doorbraak ligt echter in wat er achter de schermen gebeurt tijdens een opname.

Guidde neemt niet alleen pixels op; het registreert elke klik, scroll en latente interactie met de HTML-pagina– de subtiele pauzes, de specifieke scrolldieptes en de correcties die een mens aanbrengt als een systeem achterblijft. Deze telemetrie transformeert onbewerkte video in een Vision-Language-Action (VLA) trainingsset.

Ondertussen verbergt de Magic Redaction van het platform automatisch gevoelige gegevens zoals wachtwoorden of creditcardnummers tijdens het vastleggen, waardoor materialen veilig en op HIPAA-uitgelijnd blijven.

“Elke keer dat je op een knop klikt, sleept en neerzet, scrolt, typt, verzamelen we de interactie… alles, we zuiveren het – er is geen privé-informatie”, legt Yoav Einav, medeoprichter en CEO van Guidde, uit in een exclusief interview met VentureBeat.

Onder de motorkap legt het platform de onderliggende metadata en DOM-wijzigingen (Document Object Model) vast, gesynchroniseerd met de videoframes. De differentiator is de telemetrie die onder het oppervlak verborgen is.

Deze rijke metadata creëren een ‘digitaal wereldmodel’ van bedrijfssoftware. En omdat elke onderneming zijn eigen unieke mix van apps en processen gebruikt, Guidde creëert een datagracht waarmee bedrijfsagenten door verouderde gebruikersinterfaces kunnen redeneren met hetzelfde ruimtelijke inzicht als een mens, zodat automatisering daadwerkelijk werkt in een productieomgeving in plaats van alleen maar in een laboratoriumdemo.

Voor een mens is het een tutorial. Voor een AI-agent is het een hifi-kaart van de interface. Hierdoor kunnen agenten complexe gebruikersinterfaces ‘zien’ en doorzoeken zoals mensen dat doen, waardoor de ‘laatste mijl’ van automatisering wordt opgelost waar agenten voorheen faalden vanwege een gebrek aan specifieke bedrijfs- en in-situ gebruikscontext.

In zekere zin bouwt Guidde een ‘zelfrijdende auto’ zoals een Waymo voor computergebruik.

Product: drie pijlers van Guidd-ance

Het platform is geëvolueerd naar drie verschillende producten die zijn ontworpen om mee te groeien met de volwassenheid van een organisatie:

  1. Gids Creëren: De engine voor vakexperts om workflows binnen enkele minuten om te zetten in documentatie.

  2. Guidde Uitzending: een gepersonaliseerde aanbevelingsengine (vaak vergeleken met Netflix) die antwoorden levert binnen de tools die mensen daadwerkelijk gebruiken. Het weet wie de gebruiker is en op welke afdeling deze zich bevindt, zodat relevante inhoud precies zichtbaar wordt wanneer dat nodig is.

  3. Gids Ontdek: De onlangs gelanceerde “agentic” pijler. Net als Waze wegen in kaart brengt door chauffeurs te observeren, brengt Discover softwareroutes in kaart door bij te houden hoe werknemers werken. Het begrijpt de workflow, creëert de inhoud en werkt deze automatisch bij wanneer de gebruikersinterface verandert.

Mensen trainen in het gebruik van AI – en AI met behulp van mensen

Het meest niet voor de hand liggende aspect van de groei van Guidde is de dubbele missie. “Wij zijn het enige platform dat zowel mensen als agenten traint”, aldus Einav.

Terwijl bedrijven AI-tools zoals Microsoft 365 Copilot of ServiceNow-agents uitrollen, stuiten ze op een vaardigheidskloof. Een van Guidde’s grootste klanten onthulde dat ze meer dan $ 1 miljoen per jaar betaalden voor een geavanceerde AI-tool, maar “niemand weet hoe ze deze moeten gebruiken omdat ze wel een trainingsessie van 30 minuten leuk vonden, en dat was het dan.” Guidde dicht deze kloof door ‘hapklare’ video-tutorials aan te bieden in de flow van het werk.

Tegelijkertijd trainen deze video’s de AI-agenten zelf. Foundation-modellen zoals Gemini of GPT-4 hallucineren vaak wanneer ze specifieke bedrijfsworkflows moeten uitvoeren, omdat ze niet zijn getraind in de zeer specifieke, interne ‘vanilla-workflows’ die te vinden zijn in particuliere bedrijfssystemen. Guidde levert het ‘startpunt’, de ‘metadata’ en de ‘x-, y-coördinaten van de knop’ die een agent nodig heeft om een ​​actie te voltooien zonder vast te lopen.

Het multimodale voordeel

Om dit nauwkeurigheidsniveau te behouden, maakt Guidde gebruik van een multimodale infrastructuur. Het systeem is niet afhankelijk van één enkel model; in plaats daarvan gebruikt het een “vloot” van modellen die elkaar evalueren.

  • Google Tweelingen: Over het algemeen gebruikt voor visuele taken zoals het analyseren van PDF’s of PowerPoints.

  • Antropische Claude: Gebruikt voor het schrijven van de verhaallijn en verhalende scripts.

  • Feedbacklussen: wanneer een gebruiker een video bewerkt, worden die gegevens teruggevoerd naar het model om te voorkomen dat dezelfde fouten optreden in toekomstige opnames.

Met deze aanpak kan Guidde een oude stapel van zes of zeven losgekoppelde tools – Loom voor vastleggen, Adobe Premiere voor bewerken, 11Labs voor tekst-naar-spraak en Synthesia voor avatars – vervangen door één enkel, AI-native platform. “Wij verpakken eigenlijk alles voor u”, zegt Einav, “en automatiseren het hele proces op basis van uw merkrichtlijnen.”

Video-eerste oorsprongsverhaal

De oorsprong van Guidde ligt in een frustratie die iedere productleider kent. Voordat Einav en mede-oprichter Dan Sahar het bedrijf oprichtten, waren ze jarenlang bezig met het beheersen van het videoverkeer bij Qwilt, een bedrijf dat ze in 2010 startten om te analyseren hoe mensen naar Netflix en Disney+ keken.

Toen COVID-19 toesloeg, zagen ze een enorme kans om die video-expertise op de werkvloer toe te passen. Ze merkten op dat korte video-uitleggers de conversies van gratis naar betaalde accounts met 30% konden verhogen, maar dat de problemen bij het maken ervan onhoudbaar waren.

In een interview herinnerde Einav zich het ‘saaie werk’ van de oude wereld: ‘Mijn team in Israël creëerde de inhoud, iemand in de VS met een Amerikaans accent deed de vertelling, iemand in het marketingteam schreef het script… en iemand in het enablement-team zou de montage doen.’ Door deze gefragmenteerde workflow duurde de productie van één enkele video twee tot drie weken. “En dan twee weken later verandert het product en moet je het helemaal opnieuw doen”, voegde Einav eraan toe.

Guidde is gebouwd om deze cyclus in seconden samen te vatten. Door de ‘Magic Capture’ van een workflow te automatiseren, genereert het platform direct een gestructureerd verhalend script en een professionele AI-voice-over. Hiermee wordt het redactionele knelpunt weggenomen, waardoor vakexperts worden getransformeerd in ’trainingskrachtpatsers’.

Licenties en marktimpact

De prijsstructuur van Guidde weerspiegelt de transitie van een nutsvoorziening naar een kernonderdeel van de bedrijfsinfrastructuur:

  • Vrij: $0 (maximaal 25 video’s, ondersteuning voor webapps).

  • Pro: $ 18/maker/maand (onbeperkt aantal video’s, merkkits).

  • Bedrijf: $ 39/maker/maand (onbeperkt tekst-naar-spraak, analyse).

  • Onderneming: Aangepaste prijzen (meertalige vertaling, SSO, Magic Redaction).

De impact van het platform is al zichtbaar in de cijfers: 41% reductie in de tijd voor het maken van video’s En 34% minder inkomende supporttickets.

Voor klanten als Emerson vertaalt dit zich in een 40-60% snellere creatie van handleidingen. Vooral ondersteuningsteams merken dat ze 80% van hun ticketvolume kunnen overdragen aan agenten, maar alleen als die agenten de inhoud hebben die nuttig is.

“De agent zonder de inhoud is nutteloos”, waarschuwt Einav, waarbij hij opmerkt dat de meeste bedrijfsdocumentatie jaren verouderd is of helemaal niet gedocumenteerd is.

Vroege ontvangst door de gemeenschap en de industrie

Guidde claimt al 4.500 zakelijke klanten en wil dit aantal uitbreiden met een nieuwe financieringsronde. Ondersteunings- en operationele leiders hebben zich uitgesproken over het gebruiksgemak van het platform. Christopher Cummings, VP Client Experience bij DocNetwork, benadrukte het vermogen om “snelle, gepersonaliseerde videoreacties op vragen van klanten” te bieden.

Ondertussen merkte Wren Cotrone, directeur Klantenondersteuning, op: “Als je eenmaal de branding hebt ingesteld zoals jij dat wilt, kun je hier echt doorheen zoomen.”

Ronen Nir, Managing Director bij PSG, vatte de investeringsthese samen: “Guidde lost een van de grootste blokkers op voor een succesvolle adoptie van AI: de kennisinfrastructuur.”

Waarom dit nu belangrijk is

De paradigmaverschuiving van LLM’s met alleen tekst naar agentische video-intelligentie is de bepalende trend van 2026. Guidde’s Series B geeft aan dat de ‘grondwaarheid’ voor zakelijke agenten zal komen van ruwe video-observatie, en niet van statische documentatie.

Door vast te leggen hoe werk wordt gedaan in tientallen miljoenen workflows, bouwt Guidde een dataset op die maar weinig anderen bezitten.

Zoals Einav het verwoordde: “Het begint met mensen die betrokken zijn bij het proces, en na verloop van tijd evolueert het naar volledige autonomie.” Voor de moderne onderneming is de kaart niet langer een statisch document; het is een levende, ademende video-intelligentielaag die zowel het personeel als de agenten die hen ondersteunen begeleidt.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in