Het bouwen van een enterprise AI-bedrijf op een ‘fundament van drijfzand’ is vandaag de dag de centrale uitdaging voor oprichters, aldus het leiderschap van Palonaan.
Vandaag maakt de in Palo Alto gevestigde startup – geleid door voormalige ingenieursveteranen van Google en Meta – een beslissende verticale stap in de restaurant- en horecaruimte met de lancering van vandaag van Palona Vision en Palona Workflow.
Het nieuwe aanbod transformeert de multimodale agentsuite van het bedrijf in een realtime besturingssysteem voor restaurantactiviteiten, dat camera’s, oproepen, gesprekken en gecoördineerde taakuitvoering omvat.
Het nieuws markeert een strategische draai van het bedrijf debuut begin 2025toen het voor het eerst opdook met $ 10 miljoen aan startfinanciering om emotioneel intelligente verkoopagenten op te bouwen voor brede direct-to-consumer-bedrijven.
Door de focus te beperken tot een ‘multimodale native’-benadering voor restaurants, biedt Palona nu een blauwdruk voor AI-bouwers over hoe ze verder kunnen gaan dan ‘dunne wikkels’ en diepgaande systemen kunnen bouwen die grote problemen in de fysieke wereld oplossen.
“Je bouwt een bedrijf op een fundament dat uit zand bestaat – geen drijfzand, maar stuifzand”, zegt mede-oprichter en CTO Tim Howes, verwijzend naar de instabiliteit van het huidige LLM-ecosysteem. “Dus hebben we een orkestratielaag gebouwd waarmee we modellen kunnen uitwisselen op het gebied van prestaties, vloeiendheid en kosten.”
VentureBeat sprak onlangs persoonlijk met Howes en mede-oprichter en CEO Maria Zhang op – waar anders? – een restaurant in NYC over de technische uitdagingen en de harde lessen die zijn geleerd uit hun lancering, groei en spil.
Het nieuwe aanbod: visie en workflow als ‘digitale GM’
Voor de eindgebruiker (de restauranteigenaar of exploitant) is Palona’s nieuwste release ontworpen om te functioneren als een geautomatiseerde ‘beste operations manager’ die nooit slaapt.
Palona Vision maakt gebruik van beveiligingscamera’s in de winkel om operationele signalen te analyseren, zoals wachtrijlengtes, tafelverloop, knelpunten in de voorbereiding en netheid, zonder dat daarvoor nieuwe hardware nodig is.
Het bewaakt front-of-house-gegevens zoals wachtrijlengtes, tafelwisselingen en netheid, en identificeert tegelijkertijd back-of-house-problemen zoals vertragingen bij de voorbereiding of fouten bij het instellen van stations.
Palona Workflow vult dit aan door operationele processen in meerdere stappen te automatiseren. Dit omvat het beheren van cateringbestellingen, het openen en sluiten van checklists en het bereiden van voedsel. Door videosignalen van Vision te correleren met Point-of-Sale (POS)-gegevens en personeelsbezetting, zorgt Workflow voor een consistente uitvoering op meerdere locaties.
“Palona Vision is alsof je elke locatie een digitale GM geeft”, zegt Shaz Khan, oprichter van Tono Pizzeria + Cheesesteaks, in een persbericht aan VentureBeat. “Het signaleert problemen voordat ze escaleren en bespaart mij uren per week.”
Verticaal gaan: lessen in domeinexpertise
Palona’s reis begon met een met sterren bezaaide selectie. CEO Zhang was eerder VP Engineering bij Google en CTO van Tinder, terwijl medeoprichter Howes de mede-uitvinder is van LDAP en voormalig CTO van Netscape.
Ondanks deze achtergrond was het eerste jaar van het team een les in de noodzaak van focus.
Aanvankelijk bediende Palona mode- en elektronicamerken, waarbij ze ‘wizard’- en ‘surfer-guy’-persoonlijkheden creëerde om de verkoop af te handelen. Het team realiseerde zich echter al snel dat de restaurantindustrie een unieke kans van biljoenen dollars bood die “verrassend recessiebestendig” was, maar “verbijsterd” door operationele inefficiëntie.
“Advies aan oprichters van startups: ga niet multi-industrieel”, waarschuwde Zhang.
Door te verticaliseren is Palona van een ‘dunne’ chatlaag uitgegroeid tot een ‘multi-sensorische informatiepijplijn’ die visie, stem en tekst tegelijkertijd verwerkt.
Die helderheid van focus opende toegang tot bedrijfseigen trainingsgegevens (zoals voorbereidingsplaybooks en gesprekstranscripties) terwijl het schrapen van generieke gegevens werd vermeden.
1. Bouwen op ‘stuivend zand’
Om tegemoet te komen aan de realiteit van zakelijke AI-implementaties in 2025 – waarbij er bijna wekelijks nieuwe, verbeterde modellen verschijnen – ontwikkelde Palona een orkestratielaag waarvoor patent is aangevraagd.
In plaats van te worden ‘gebundeld’ met een enkele provider zoals OpenAI of Google, stelt Palona’s architectuur hen in staat modellen voor een dubbeltje uit te wisselen op basis van prestaties en kosten.
Ze gebruiken een mix van eigen en open-sourcemodellen, waaronder Gemini voor benchmarks voor computervisie en specifieke taalmodellen voor vloeiend Spaans of Chinees.
Voor bouwers is de boodschap duidelijk: laat de kernwaarde van uw product nooit afhankelijk zijn van één leverancier.
2. Van woorden naar ‘wereldmodellen’
De lancering van Palona Vision vertegenwoordigt een verschuiving van het begrijpen van woorden naar het begrijpen van de fysieke realiteit van een keuken.
Terwijl veel ontwikkelaars moeite hebben om afzonderlijke API’s aan elkaar te koppelen, transformeert Palona’s nieuwe visiemodel bestaande camera’s in de winkel in operationele assistenten.
Het systeem identificeert in realtime ‘oorzaak en gevolg’: herkent of een pizza niet gaar is vanwege de ‘lichtbeige’ kleur of waarschuwt een manager als een vitrine leeg is.
“In woorden: natuurkunde doet er niet toe”, legde Zhang uit. “Maar in werkelijkheid laat ik de telefoon vallen, hij gaat altijd af… we willen echt weten wat er aan de hand is in deze wereld van restaurants”.
3. De ‘Muffin’-oplossing: aangepaste geheugenarchitectuur
Een van de belangrijkste technische hindernissen waarmee Palona te maken kreeg, was geheugenbeheer. In een restaurantcontext is herinnering het verschil tussen een frustrerende interactie en een ‘magische’ interactie waarbij de agent de ‘gebruikelijke’ bestelling van een diner onthoudt.
Het team gebruikte aanvankelijk een niet-gespecificeerde open-sourcetool, maar ontdekte dat deze in 30% van de gevallen fouten opleverde. “Ik denk dat adviserende ontwikkelaars altijd het geheugen uitschakelen (op AI-producten voor consumenten), omdat dat garandeert dat alles in de war raakt”, waarschuwde Zhang.
Om dit op te lossen bouwde Palona Muffin, een eigen geheugenbeheersysteem genaamd als een knipoog naar webcookies. In tegenstelling tot standaard vectorgebaseerde benaderingen die worstelen met gestructureerde gegevens, is Muffin ontworpen om met vier verschillende lagen om te gaan:
-
Gestructureerde gegevens: stabiele feiten zoals afleveradressen of allergie-informatie.
-
Langzaam veranderende dimensies: loyaliteitsvoorkeuren en favoriete items.
-
Voorbijgaande en seizoensherinneringen: Aanpassing aan verschuivingen, zoals de voorkeur voor koude dranken in juli versus warme chocolademelk in de winter.
-
Regionale context: standaardinstellingen zoals tijdzones of taalvoorkeuren.
De les voor bouwers: als de best beschikbare tool niet goed genoeg is voor uw specifieke branche, moet u bereid zijn uw eigen tool te bouwen.
4. Betrouwbaarheid door ‘GRACE’
In een keuken is een AI-fout niet zomaar een typefout; het is een verspilde bestelling of een veiligheidsrisico. Een recent incident op Stefanina’s Pizzeria in Missouri, waar een AI tijdens een diner haast nepdeals hallucineerdebenadrukt hoe snel het merkvertrouwen kan verdampen als er geen waarborgen zijn.
Om een dergelijke chaos te voorkomen, volgen de ingenieurs van Palona het interne systeem GRACE-framework:
-
Vangrails: harde limieten voor het gedrag van agenten om niet-goedgekeurde promoties te voorkomen.
-
Red Teaming: Proactieve pogingen om de AI te ‘breken’ en potentiële hallucinatietriggers te identificeren.
-
App Sec: Vergrendel API’s en integraties van derden met TLS, tokenisatie en systemen voor aanvalspreventie.
-
Naleving: elke reactie wordt gebaseerd op geverifieerde, doorgelichte menugegevens om nauwkeurigheid te garanderen.
-
Escalatie: complexe interacties doorsturen naar een menselijke manager voordat een gast verkeerde informatie ontvangt.
Deze betrouwbaarheid wordt geverifieerd door middel van grootschalige simulatie. “We hebben een miljoen manieren gesimuleerd om pizza te bestellen”, zei Zhang, waarbij hij de ene AI gebruikte om als klant op te treden en de andere om de bestelling op te nemen, waarbij hij de nauwkeurigheid meette om hallucinaties te elimineren.
De onderste regel
Met de lancering van Vision en Workflow gokt Palona erop dat de toekomst van enterprise AI niet in brede assistenten ligt, maar in gespecialiseerde ‘besturingssystemen’ die binnen een specifiek domein kunnen zien, horen en denken.
In tegenstelling tot AI-agenten voor algemene doeleinden, is het systeem van Palona ontworpen om restaurantworkflows uit te voeren en niet alleen te reageren op vragen. Het is in staat klanten te onthouden, hen hun ‘gebruikelijke’ bestelling te horen bestellen, en de restaurantactiviteiten te monitoren om ervoor te zorgen dat ze die klant het eten bezorgen volgens hun interne processen en richtlijnen, en signaleert wanneer er iets misgaat of cruciaal is. over fout gaan.
Voor Zhang is het doel om menselijke operators zich op hun vak te laten concentreren: “Als je dat heerlijke eten te pakken hebt… zullen we je vertellen wat je moet doen.”



