Microsoft vandaag gelanceerd MAI-Image-2-Efficiënteen goedkopere, snellere variant van zijn vlaggenschip tekst-naar-beeldmodel dat volgens het bedrijf productieklare kwaliteit levert voor bijna de helft van de prijs. De release, onmiddellijk beschikbaar in Microsoft-gieterij En MAI-speeltuin zonder wachtlijst, markeert de snelste ommekeer tot nu toe van het interne AI-superintelligentieteam van Microsoft – en het duidelijkste signaal dat Redmond serieus is over het bouwen van een zelfvoorzienende AI-stack die niet afhankelijk is van OpenAI.
Het nieuwe model kost $5 per miljoen tekstinvoertokens en $19,50 per miljoen beelduitvoertokens, een een reductie van ongeveer 41% van MAI-Image-2’s prijzen van respectievelijk $ 5 en $ 33 voor dezelfde niveaus. Microsoft zegt dat het model 22% sneller werkt dan zijn vlaggenschip en een 4x grotere doorvoerefficiëntie per GPU behaalt, gemeten op NVIDIA H100-hardware met een resolutie van 1024×1024. Het bedrijf beweert ook dat het concurrerende hyperscaler-modellen overtreft, waarbij hij specifiek die van Google noemt Gemini 3.1 Flitser, Gemini 3.1 Flash-afbeeldingEn Gemini 3 Pro-afbeelding — met gemiddeld 40% op p50-latentiebenchmarks.
Het model wordt ook over de hele wereld uitgerold Tweede piloot En Bingzei Microsoft, en er zullen nog meer productoppervlakken volgen.
De tweemodellenstrategie van Microsoft leent een pagina uit het AI-prijsplaybook
Microsoft positioneert MAI-Image-2-Efficiënt en zijn vlaggenschip MAI-afbeelding-2 als complementaire tools in plaats van elkaar te vervangen – een gelaagde koppeling die is ontworpen om het volledige spectrum van behoeften op het gebied van het genereren van bedrijfsimages te dekken.
MAI-Image-2-Efficiënt richt zich op grote, kostengevoelige productieworkloads: productfotografie, marketingmateriaal, UI-mockups, pipelines voor merkactiva en realtime interactieve toepassingen. Het verwerkt korte tekst in beeld, zoals koppen en labels, netjes, aldus Microsoft, en is gebouwd om te werken binnen de strakke latentie- en budgetbeperkingen van batchverwerkingsomgevingen. MAI-afbeelding-2ondertussen, blijft het precisie-instrument van het bedrijf – het model waar je naar streeft als de opdracht de hoogste fotorealistische natuurgetrouwheid, complexe stilering zoals anime of illustratie, of langere, ingewikkeldere in-beeld typografie vereist. Microsoft vertelt zakelijke klanten effectief: gebruik het efficiënte model voor uw assemblagelijn en het vlaggenschip voor uw showcase.
Deze aanpak weerspiegelt prijsstrategieën die in de hele AI-industrie hebben gewerkt: OpenAI GPT-modellagenAntropisch Haiku-Sonnet-Opus-opstellingGoogle’s Flash-Pro-onderscheiding – maar past het specifiek toe op het genereren van afbeeldingen, een domein waar de kosten-per-afbeelding-economie de productie-implementatie op schaal kan maken of breken.
Hoe Microsoft in minder dan een maand een voor productie geoptimaliseerd imagemodel op de markt bracht
De snelheid van deze release verdient aandacht. MAI-Image-2 zelf debuteerde pas op 19 maart op MAI Playground zoals VentureBeat eerder melddemet bredere beschikbaarheid via Microsoft-gieterij arriveert op 2 april naast twee andere nieuwe funderingsmodellen: MAI-Transcribe-1 (een spraak-naar-tekstmodel dat 25 talen ondersteunt) en MAI-Voice-1 (een audiogeneratiemodel). Nog geen maand later heeft Microsoft een geoptimaliseerde productievariant op de markt gebracht.
Die cadans suggereert de MAI Superintelligence-team – de onderzoeksgroep onder leiding van Mustafa Suleyman, CEO van Microsoft AI, die in november 2025 werd opgericht – opereert meer als een startup die iteratieve producten verzendt dan als een traditioneel bedrijfsonderzoekslaboratorium dat artikelen publiceert. Toen Suleyman in zijn blogpost van 2 april schreef dat het team “het bouwen van humanistische AIMet een focus op het optimaliseren van de manier waarop mensen daadwerkelijk communiceren, trainen voor praktisch gebruik, lijkt hij het letterlijk te hebben bedoeld: de modellen worden niet alleen verzonden, ze worden snel genoeg verzonden om productroadmaps te hebben.
De vroege ontvangst voor MAI-afbeelding-2 was bijzonder positief. Decoderen gerapporteerd in zijn praktijkgerichte beoordeling dat het model al de nummer 3-positie had bereikt op de Arena.ai-klassement voor het genereren van afbeeldingen, alleen gevolgd door Google en OpenAI. De recensent van Decrypt merkte op dat het fotorealisme van het model “een echte kracht” was en dat de tekstweergave “een legitiem hoogtepunt” was dat “complexe typografie met veel meer consistentie verwerkte dan we hadden verwacht”. Uit het onderzoek bleek ook dat in sommige directe vergelijkingen MAI-afbeelding-2 presteerde beter dan OpenAI’s GPT-Image op het gebied van beeldkwaliteit en tekstweergave, ondanks dat het daaronder op het scorebord stond – een observatie die onderstreept hoe benchmark-ranglijsten niet altijd het praktische nut weergeven.
Dat gezegd hebbende, werd het oorspronkelijke model geleverd met aanzienlijke beperkingen die door Decrypt werden gemarkeerd: een afkoelperiode van 30 seconden tussen generaties, een dagelijkse limiet van 15 afbeeldingen in de oorspronkelijke gebruikersinterface, slechts een beeldverhouding van 1:1, geen mogelijkheden voor afbeelding naar afbeelding en agressieve inhoudfiltering die zelfs onschadelijke creatieve aanwijzingen blokkeerde. Of MAI-Image-2-Efficiënt deze beperkingen overerft of versoepelt, wordt in de aankondiging van vandaag niet behandeld, en zakelijke klanten die toegang krijgen tot het model via de Foundry API zullen waarschijnlijk met andere beperkingen worden geconfronteerd dan speeltuingebruikers.
Binnen de wankele Microsoft-OpenAI-relatie die interne modellen onvermijdelijk maakte
De lancering van vandaag kan niet op zichzelf worden begrepen. Het komt op een moment waarop de relatie tussen Microsoft En Open AI – ooit het bepalende partnerschap van het generatieve AI-tijdperk – rafelt zichtbaar uit zijn voegen.
Gisteren meldde CNBC dat de nieuw benoemde Chief Revenue Officer van OpenAI, Denise Dresser, een bericht stuurde interne memo aan het personeel expliciet stellend dat het Microsoft-partnerschap “ook ons vermogen heeft beperkt om bedrijven te ontmoeten waar ze zich bevinden.” In de memo werd naar verluidt de nieuwe alliantie van OpenAI met Amazon Web Services en het Bedrock-platform aangeprezen als een belangrijke groeimotor, waarbij de inkomende vraag van klanten werd omschreven als “eerlijk gezegd onthutsend” sinds de samenwerking eind februari werd aangekondigd. Microsoft heeft OpenAI toegevoegd aan zijn lijst met concurrenten in haar jaarverslag medio 2024. OpenAI heeft ondertussen zijn cloudinfrastructuur gediversifieerd KernWeef, GooglenEn Orakelwaardoor de afhankelijkheid van Microsoft Azure afneemt.
De MAI-familiemodel is de meest tastbare uitdrukking van Microsofts kant van die strategische ontkoppeling. Wanneer Microsoft met zijn eigen model afbeeldingen van productiekwaliteit kan genereren voor $ 19,50 per miljoen outputtokens, verandert de berekening voor het blijven licentiëren van OpenAI’s afbeeldingsmodellen – en het betalen van OpenAI een deel van de resulterende inkomsten – dramatisch. Elk MAI-model dat productiekwaliteit bereikt, is een regelitem dat Microsoft mogelijk van de balans van OpenAI naar zijn eigen balans kan verplaatsen.
De organisatorische infrastructuur om deze verschuiving te ondersteunen is al aanwezig. Op 17 maart, zoals bekendgemaakt in de mededelingen op De officiële blog van MicrosoftCEO Satya Nadella kondigde een ingrijpende reorganisatie aan die de consumenten- en commerciële Copilot-inspanningen van het bedrijf onder één leiderschapsteam verenigde, waarbij Jacob Andreou werd verheven tot EVP van Copilot en rechtstreeks rapporteerde aan Nadella. Cruciaal was dat de reorganisatie ook de rol van Suleyman opnieuw concentreerde. Zoals Nadella in zijn bericht aan de werknemers schreef, “verdubbelt het bedrijf onze superintelligentiemissie met het talent en de rekenkracht om modellen te bouwen die een echte productimpact hebben, in termen van evaluaties, COGS-reductie en het verleggen van de grens.” Die zinsnede – ‘COGS-reductie’ – is bedrijfstaal voor het verlagen van de kosten van verkochte goederen, en verwijst rechtstreeks naar de economische motivatie achter modellen als MAI-Image-2-Efficient. Elke dollar die Microsoft bespaart door eigen modellen te gebruiken in plaats van licenties van partners te gebruiken, vloeit rechtstreeks naar de brutomarge.
Waarom goedkope, snelle beeldgeneratie het geheime ingrediënt is voor de agentische AI-toekomst van Microsoft
Er is nog een dimensie die de release van vandaag van strategisch belang maakt, en misschien wel de belangrijkste: de opkomst van AI-agenten.
Dat meldt TechCrunch Gisteren heeft Microsoft manieren getest om OpenClaw-achtige functies te integreren in Microsoft 365 Copilot, en zo te bouwen aan een altijd actieve agent die taken in meerdere stappen gedurende langere perioden kan uitvoeren. Het bedrijf heeft ook Copilot Cowork gelanceerd (een agent die acties onderneemt binnen Microsoft 365-apps), Copilot Tasks (een agent voor het voltooien van persoonlijke productiviteitstaken in meerdere stappen) en Agent 365 (waarnaar wordt verwezen in Nadella’s reorganisatiememo van maart). Verwacht wordt dat Microsoft deze agentmogelijkheden zal demonstreren tijdens de Build-conferentie in juni.
In een agentische wereld – waar AI-systemen niet alleen vragen beantwoorden, maar ook autonoom complexe workflows uitvoeren – wordt het genereren van afbeeldingen een primitief dat agenten programmatisch aanroepen, en niet een op zichzelf staand product waar gebruikers handmatig mee communiceren. Een bedrijfsagent die een marketingcampagne opzet, moet mogelijk tientallen productafbeeldingen genereren, sociale media-items creëren, presentatieafbeeldingen produceren en ontwerpconcepten herhalen, allemaal zonder menselijke tussenkomst bij elke stap. De economische aspecten van die workflow worden volledig bepaald door de prijzen en latentie per token, en dat is precies waar MAI-Image-2-Efficient voor optimaliseert. Als de visie van Microsoft voor Copilot agenten omvat die afbeeldingen genereren als een routinematige subtaak binnen grotere workflows, hebben deze agenten behoefte aan het genereren van afbeeldingen die snel genoeg zijn om geen knelpunten te creëren en goedkoop genoeg om de kosten niet op te blazen als ze duizenden keren per dag worden gebeld. De viervoudige efficiëntieverbetering en de prijsverlaging van 41% zijn niet alleen mooie marketingcijfers; het zijn architectonische vereisten voor de agentische toekomst waar Microsoft het bedrijf op inzet.
Wat Microsoft nog steeds niet heeft beantwoord over zijn nieuwe afbeeldingsmodel
Verschillende belangrijke vragen blijven onbeantwoord in de aankondiging van vandaag. Microsoft heeft niet bekendgemaakt of MAI-Image-2-Efficiënt lost de beperkingen van de beeldverhouding en agressieve inhoudfiltering op die recensenten in het oorspronkelijke model signaleerden. Het bedrijf heeft ook niet gespecificeerd of de compromissen tussen kwaliteit en snelheid zichtbare achteruitgang met zich meebrengen op complexe aanwijzingen – de aankondiging beschrijft “productieklare kwaliteit” en “vlaggenschipkwaliteit” door elkaar, maar distillatiemodellen van welke aard dan ook brengen doorgaans een bepaalde kwaliteitsconcessie met zich mee.
De voetnoten in het persbericht onthullen ook de beperkte omstandigheden waaronder de benchmarkclaims werden getest: efficiëntiecijfers werden gemeten op NVIDIA H100 op 1024×1024 met “geoptimaliseerde batchgroottes en overeenkomende latentiedoelen”, en de latentievergelijkingen met Google-modellen werden uitgevoerd op p50 (mediaan) in plaats van p95 of p99, wat de prestaties in het slechtste geval zou weergeven. Enterprise-klanten die verschillende workloads op verschillende gelijktijdigheidsniveaus uitvoeren, kunnen verschillende resultaten zien. MAI Playground is momenteel alleen beschikbaar in geselecteerde markten, waaronder de VS, waarbij de beschikbaarheid in de EU wordt vermeld als ‘binnenkort beschikbaar’. De integratie van de copilot is gaande, maar nog niet voltooid. En de bedrijfs-API via Foundry bevindt zich, terwijl deze live is, nog in de beginfase.
Maar het traject is onmiskenbaar. In minder dan vijf maanden sinds de MAI Superintelligence-team werd aangekondigd, heeft Microsoft een vlaggenschip beeldmodel, drie extra funderingsmodellenen nu A kostengeoptimaliseerde productievariant – en dat terwijl de hele Copilot-organisatie werd gereorganiseerd, de relatie met de belangrijkste AI-partner werd verstoord, en de basis werd gelegd voor agentische AI-functies die de bedrijfsproductiviteit opnieuw zouden kunnen definiëren. Of dat allemaal snel genoeg is om het momentum van Anthropic te grijpen, de drift van OpenAI richting Amazon in te dammen en een koersdoel van $600 te rechtvaardigen, is de vraag van honderden miljarden dollars. Maar voor een bedrijf dat de eerste twee jaar van het generatieve AI-tijdperk vooral de technologie van iemand anders heeft doorverkocht, doet Microsoft nu iets wat het al heel lang niet meer heeft gedaan op het gebied van AI: zijn eigen werk verzenden, volgens zijn eigen schema, tegen zijn eigen prijs – en de markt uitdagen om bij te blijven.


