Home Nieuws OpenAI’s GPT Image 1.5 daagt Google uit op het gebied van visuals...

OpenAI’s GPT Image 1.5 daagt Google uit op het gebied van visuals op bedrijfsniveau

3
0
OpenAI’s GPT Image 1.5 daagt Google uit op het gebied van visuals op bedrijfsniveau

OpenAI heeft zijn aanbod voor het genereren van afbeeldingen in zijn nieuwste versie nauwkeuriger en consistenter gemaakt update naar ChatGPT-afbeeldingennu steeds meer bedrijven en merken AI-beeldgeneratie gebruiken om te helpen bij de visualisatie van ontwerpen.

De updates worden uitgerold naar alle ChatGPT-gebruikers en de API als GPT-afbeelding 1.5. Het bedrijf zei van wel mogelijk gemaakt door GPT 5.2wat veel vroege gebruikers een krachtige update vonden voor zakelijk gebruik.

“De eerste ervaring van veel mensen met ChatGPT is het omzetten van een tekstprompt in een afbeelding”, zegt Fidji Simo, OpenAI CEO van Applications, in een Substack-bericht. “Het is een magische manier om te zien wat deze technologie kan doen, maar de chatinterface is hier oorspronkelijk niet voor ontworpen. Het maken en bewerken van afbeeldingen is een ander soort taak en verdient een ruimte die is gebouwd voor beeld.”

Bedrijfsvriendelijke updates bij nauwkeurige bewerking en het volgen van instructies

Een van de grootste updates van ChatGPT Images is het doelgerichter bewerken, zelfs wanneer de afbeelding op het chatplatform wordt gegenereerd in plaats van via de API. Modellen voor het genereren van afbeeldingen, zoals ChatGPT Images, Google’s Nano Banana en Stable Diffusion, prijzen op prompts gebaseerde aanpassingen aan door AI gemaakte afbeeldingen, waarbij de gebruiker specifieke delen van de foto kan aanwijzen om te wijzigen. Maar deze functies kunnen soms wisselvallig zijn.

Met de update zegt OpenAI dat het model beter aansluit bij wat de gebruiker wil, “terwijl elementen als belichting, compositie en het uiterlijk van mensen consistent blijven bij alle invoer, uitvoer en daaropvolgende bewerkingen.”

Gebruikers kunnen het model de opdracht geven om de meeste soorten beeldbewerking uit te voeren, zoals het toevoegen of verwijderen van een element, combineren, overvloeien en transponeren.

OpenAI zei dat dit model “instructies betrouwbaarder volgt” dan eerdere versies. Het is ook in staat om tekst beter weer te geven en daadwerkelijke, leesbare letters te genereren, zelfs als deze dichter of kleiner zijn. OpenAI heeft het model bijgewerkt om betere, kleinere gezichten te creëren op foto’s van een grote groep mensen.

“Deze transformaties werken voor zowel eenvoudige als meer ingewikkelde concepten, en zijn gemakkelijk uit te proberen met behulp van vooraf ingestelde stijlen en ideeën in de nieuwe ChatGPT Images-functie – geen schriftelijke prompt vereist”, aldus OpenAI.

Strijd tussen de beeldgeneratoren

De afbeeldingsmodelupdate van OpenAI komt na die van Google veelgeprezen Nano Banana Pro image-model, dat lovende kritieken kreeg van de ontwikkelaarsgemeenschap.

Het bedrijf moet concurreren met andere steeds groter wordende, voortdurend verbeterende modellen voor het genereren van afbeeldingen die tot doel hebben meer zakelijke gebruikers aan te trekken. En het is niet alleen Google waar OpenAI mee te maken heeft. Dat maakte Alibaba in augustus bekend dat Qwen-beeld kan leesbare tekst weergeven in zowel het Chinees als het Engels. Zwarte Woud Labs vrijgegeven Flux.2dat ook een robuust, open-source afbeeldingsmodel biedt.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in