Home Nieuws Microsoft brengt nieuwe AI-modellen uit om verder uit te breiden dan OpenAI

Microsoft brengt nieuwe AI-modellen uit om verder uit te breiden dan OpenAI

7
0
Microsoft brengt nieuwe AI-modellen uit om verder uit te breiden dan OpenAI

Mustafa Suleyman, CEO van Microsoft AI. (GeekWire-bestandsfoto/Kevin Lisota)

Microsoft breidt zijn assortiment interne AI-modellen uit, brengt een nieuw spraak-naar-tekst-systeem uit en maakt twee bestaande modellen voor het eerst breed beschikbaar voor ontwikkelaars.

De stappen van Microsoft AI (MAI) maken deel uit van een bredere inspanning van het bedrijf om zijn eigen AI-mogelijkheden uit te breiden buiten de samenwerking met OpenAI, waardoor Microsoft meer controle krijgt over zijn eigen lot in de concurrentie tegen Google, Amazon en anderen.

Microsoft aangekondigd MAI-Transcribe-1 op donderdag, een spraak-naar-tekst-model dat volgens hem het meest nauwkeurige is dat momenteel beschikbaar is. Het bedrijf bracht ook zijn bestaande modellen voor het genereren van spraak en beelden, bekend als MAI-Voice-1 en MAI-Image-2, uit voor breed commercieel gebruik.

Het is Microsoft’s eerste grote modelrelease sindsdien een reorganisatie in maartaangekondigd door CEO Satya Nadella, waarin Mustafa Suleyman, CEO van Microsoft AI, afstand nam van het dagelijkse Copilot-toezicht om zich te concentreren op de ontwikkeling van grensmodellen en superintelligentie.

Suleiman vertelde De Verge dat het transcriptiemodel werkt tegen “de helft van de GPU-kosten van de andere ultramoderne modellen.” Hij vertelde VentureBeat dat het model is gebouwd door een team van slechts tien mensen, en dat Microsoft van plan is om uiteindelijk een grensoverschrijdend groottaalmodel te bouwen om indien nodig “volledig onafhankelijk” te zijn.

Microsoft heeft onlangs ook voormalig Allen Institute ingehuurd voor CEO Ali Farhadi en andere top AI-onderzoekers van het in Seattle gevestigde instituut om het team van Suleyman verder te versterken. GeekWire gemeld vorige week.

MAI-Transcribe-1 is ontworpen om te kunnen omgaan met luidruchtige omstandigheden in de echte wereld, zoals callcenters en vergaderruimtes, en Microsoft zegt dat het integraties met Copilot en Teams test. Microsoft zegt dat het de beste prijs-kwaliteitverhouding biedt van alle grote cloudproviders en rechtstreeks concurreert met OpenAI’s Whisper en Google’s Gemini op de FLEURS-benchmark.

In een blogpostnoemde Suleyman het model “niet alleen het meest nauwkeurige, maar ook razendsnel.”

MAI-Voice-1 genereert natuurlijk klinkende spraak en laat ontwikkelaars nu aangepaste stemmen maken op basis van korte fragmenten van voorbeeldaudio. MAI-Image-2 staat in de top drie van het Arena.ai-klassement voor het genereren van afbeeldingen en wordt uitgerold in Bing en PowerPoint.

Alle drie zijn beschikbaar op het Microsoft Foundry-ontwikkelaar AI-platform en MAI Playground.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in