Home Nieuws Baidu onthult eigen ERNIE 5 die de prestaties van GPT-5 verslaat op...

Baidu onthult eigen ERNIE 5 die de prestaties van GPT-5 verslaat op het gebied van grafieken, documentbegrip en meer

14
0
Baidu onthult eigen ERNIE 5 die de prestaties van GPT-5 verslaat op het gebied van grafieken, documentbegrip en meer

Slechts enkele uren nadat OpenAI zijn vlaggenschipfunderingsmodel had bijgewerkt GPT-5 tot GPT-5.1die in het algemeen een verminderd tokengebruik belooft en een aangenamere persoonlijkheid met meer vooraf ingestelde opties, Chinese zoekgigant Baidu onthulde zijn volgende generatie funderingsmodel, ERNIE 5.0, naast een reeks AI-productupgrades en strategische internationale uitbreidingen.

Het doel: positioneren als mondiale concurrent op de steeds competitiever wordende zakelijke AI-markt.

Aangekondigd tijdens het Baidu World 2025-evenement van het bedrijf, is ERNIE 5.0 een eigen, native omnimodaal model dat is ontworpen om gezamenlijk inhoud te verwerken en te genereren in de vorm van tekst, afbeeldingen, audio en video.

In tegenstelling tot de onlangs uitgebrachte Baidu ERNIE-4.5-VL-28B-A3B-Denkendat open source is onder een ondernemingsvriendelijke en tolerante Apache 2.0-licentie, is ERNIE 5.0 een eigen model en alleen beschikbaar via Baidu’s ERNIE Bot website (ik moest het handmatig selecteren in de vervolgkeuzelijst met modelkiezers) en de Qianfan cloudplatform application programming interface (API) voor zakelijke klanten.

Naast de lancering van het model introduceerde Baidu belangrijke updates voor zijn digitale menselijke platform, tools zonder code en AI-agenten voor algemene doeleinden – allemaal gericht op het uitbreiden van zijn AI-voetafdruk buiten China.

Het bedrijf introduceerde ook ERNIE 5.0 Preview 1022, een variant die is geoptimaliseerd voor tekstintensieve taken, naast het algemene preview-model dat over de verschillende modaliteiten heen balanceert.

Baidu benadrukte dat ERNIE 5.0 een verschuiving vertegenwoordigt in de manier waarop intelligentie op grote schaal wordt ingezet, waarbij CEO Robin Li verklaarde: “Wanneer je AI internaliseert, wordt het een native mogelijkheid en transformeert intelligentie van een kostenpost in een bron van productiviteit.”

Waar ERNIE 5.0 GPT-5 en Gemini 2.5 Pro overtreft

De benchmarkresultaten van ERNIE 5.0 suggereren dat Baidu pariteit (of bijna pariteit) heeft bereikt met de beste westerse funderingsmodellen over een breed spectrum van taken.

In openbare benchmarkdia’s die tijdens het Baidu World 2025-evenement werden gedeeld, presteerde ERNIE 5.0 Preview beter dan of evenaarde het OpenAI’s GPT-5-High en Google’s Gemini 2.5 Pro in multimodaal redeneren, documentbegrip en op afbeeldingen gebaseerde QAterwijl ook het demonstreren van sterke vaardigheden op het gebied van taalmodellering en code-uitvoering.

Het bedrijf benadrukte zijn vermogen om gezamenlijke input en output over verschillende modaliteiten heen te verwerken, in plaats van te vertrouwen op post-hoc modaliteitsfusie, die het omschreef als een technische differentiator.

Op visuele taken behaalde ERNIE 5.0 leidende scores op OCRBench, DocVQA en ChartQA, drie benchmarks die documentherkenning, -begrip en gestructureerde data-redenering testen.

Baidu beweert dat het model zowel GPT-5-High als Gemini 2.5 Pro versloeg op deze op documenten en grafieken gebaseerde benchmarks, gebieden die het beschrijft als de kern van bedrijfstoepassingen zoals geautomatiseerde documentverwerking en financiële analyse.

Bij het genereren van afbeeldingen evenaarde of overtrof ERNIE 5.0 Google’s Veo3 in categorieën, waaronder semantische uitlijning en beeldkwaliteit, volgens Baidu’s interne, op GenEval gebaseerde evaluatie. Baidu beweerde dat de multimodale integratie van het model het mogelijk maakt om visuele inhoud te genereren en te interpreteren met een groter contextueel bewustzijn dan modellen die vertrouwen op modaliteitsspecifieke encoders.

Voor audio- en spraaktaken demonstreerde ERNIE 5.0 concurrerende resultaten op de MM-AU- en TUT2017-benchmarks voor audiobegrip, evenals het beantwoorden van vragen op basis van gesproken taalinvoer. De audioprestaties, hoewel niet zo zwaar benadrukt als visie of tekst, suggereren een brede voetafdruk die bedoeld is om multimodale toepassingen met een volledig spectrum te ondersteunen.

Bij taaltaken liet het model sterke resultaten zien op het gebied van het volgen van instructies, het beantwoorden van feitelijke vragen en wiskundig redeneren – kerngebieden die het zakelijke nut van grote taalmodellen bepalen.

De Preview 1022-variant van ERNIE 5.0, op maat gemaakt voor tekstuele prestaties, liet zelfs sterkere taalspecifieke resultaten zien bij vroege toegang voor ontwikkelaars. Hoewel Baidu geen brede superioriteit claimt op het gebied van algemene taalredeneringen, suggereren de interne evaluaties dat ERNIE 5.0 Preview 1022 de kloof met Engelstalige topmodellen overbrugt en deze beter presteert op het gebied van Chineestalige prestaties.

Hoewel Baidu geen volledige benchmarkdetails of ruwe scores publiekelijk heeft vrijgegeven, suggereert de positionering van de prestaties een doelbewuste poging om ERNIE 5.0 niet als een multimodaal nichesysteem te beschouwen, maar als een vlaggenschipmodel dat concurreert met de grootste gesloten modellen op het gebied van redeneren voor algemene doeleinden.

Waar Baidu beweert dat hij een duidelijke voorsprong heeft, is het gestructureerd begrijpen van documenten, het redeneren van visuele grafieken en de integratie van meerdere modaliteiten in één enkele, native modelleringsarchitectuur. Onafhankelijke verificatie van deze resultaten blijft hangende, maar de breedte van de geclaimde capaciteiten positioneert ERNIE 5.0 als een serieus alternatief in het multimodale funderingsmodellandschap.

Prijsstrategie voor ondernemingen

ERNIE 5.0 bevindt zich op de einde premie van Baidu’s modelprijsstructuur. Het bedrijf heeft specifieke prijzen vrijgegeven voor API-gebruik op zijn Qianfan-platform, waardoor de kosten in lijn worden gebracht met andere topaanbiedingen van Chinese concurrenten zoals Alibaba.

Model

Invoerkosten (per 1K-tokens)

Uitvoerkosten (per 1K-tokens)

Bron

ERNIE 5.0

$ 0,00085 (¥ 0,006)

$ 0,0034 (¥ 0,024)

Qianfan

ERNIE 4.5 Turbo (bijv.)

$ 0,00011 (¥ 0,0008)

$ 0,00045 (¥ 0,0032)

Qianfan

Qwen3 (voorbeeld codeur)

$ 0,00085 (¥ 0,006)

$ 0,0034 (¥ 0,024)

Qianfan

Het contrast in kosten tussen ERNIE 5.0 en eerdere modellen zoals ERNIE 4.5 Turbo onderstreept de strategie van Baidu om onderscheid te maken tussen modellen met een hoog volume en lage kosten en modellen met hoge capaciteiten die zijn ontworpen voor complexe taken en multimodaal redeneren.

Vergeleken met andere Amerikaanse alternatieven blijft het qua prijs gemiddeld:

Model

Invoer (/1 miljoen tokens)

Uitvoer (/1 miljoen tokens)

Bron

GPT-5.1

$ 1,25

$ 10,00

Open AI

ERNIE 5.0

$ 0,85

$ 3,40

Qianfan

ERNIE 4.5 Turbo (bijv.)

$ 0,11

$ 0,45

Qianfan

Sluit werk 4.1

$ 15,00

$ 75,00

Antropisch

Tweeling 2.5 Pro

$1,25 (≤200k) / $2,50 (>200k)

$10,00 (≤200k) / $15,00 (>200k)

Google Vertex AI-prijzen

Grok 4 (grok-4-0709)

$ 3,00

$ 15,00

xAI-API

Mondiale expansie: producten en platforms

Gelijktijdig met de modelrelease breidt Baidu zich internationaal uit:

  • GenFlow 3.0nu met meer dan 20 miljoen gebruikers, is de grootste AI-agent voor algemene doeleinden van het bedrijf en beschikt over verbeterd geheugen en multimodale taakafhandeling.

  • Bekendeen zichzelf ontwikkelende agent die complexe problemen dynamisch kan oplossen, is nu commercieel verkrijgbaar via uitnodiging.

  • Angstde internationale versie van Baidu’s codeloze bouwer Miaoda, is wereldwijd live via medo.dev.

  • Oreaateen productiviteitswerkruimte met ondersteuning voor documenten, dia’s, afbeeldingen, video en podcasts, heeft wereldwijd meer dan 1,2 miljoen gebruikers bereikt.

Het digitale menselijke platform van Baidu, dat al in Brazilië is uitgerold, maakt ook deel uit van de wereldwijde push. Volgens bedrijfsgegevens maakte 83% van de livestreamers tijdens het “Double 11” winkelevenement van dit jaar in China gebruik van de digitale menselijke technologie van Baidu, wat bijdroeg aan een stijging van 91% in GMV.

Ondertussen heeft Baidu’s autonome taxidienst Apollo Go de grens van 17 miljoen ritten overschreden, beheert het zelfrijdende wagenparken in 22 steden en claimt de titel van ’s werelds grootste robotaxinetwerk.

Open source visie-taalmodel trekt aandacht van de industrie

Twee dagen voor het vlaggenschip ERNIE 5.0-evenement bracht Baidu ook een open-source multimodaal model uit onder de Apache 2.0-licentie: ERNIE-4.5-VL-28B-A3B-Denken.

Als gerapporteerd door mijn collega Michael Nuñez bij VentureBeatactiveert het model slechts 3 miljard parameters terwijl het een totaal van 28 miljard behoudt, waarbij gebruik wordt gemaakt van een Mixture-of-Experts (MoE)-architectuur voor efficiënte gevolgtrekking.

Belangrijke technische innovaties zijn onder meer:

  • “Denken met Afbeeldingen”, dat dynamische, op zoom gebaseerde visuele analyse mogelijk maakt

  • Ondersteuning voor kaartinterpretatie, documentbegrip, visuele basis en tijdsbewustzijn in video

  • Runtime op één enkele GPU van 80 GB, waardoor deze toegankelijk is voor middelgrote organisaties

  • Volledige compatibiliteit met Transformers, vLLM en Baidu’s FastDeploy-toolkits

Deze release verhoogt de druk op closed-sourceconcurrenten. Met Apache 2.0-licenties wordt ERNIE-4.5-VL-28B-A3B-Thinking een levensvatbaar basismodel voor commerciële toepassingen zonder licentiebeperkingen – iets wat maar weinig goed presterende modellen in deze klasse bieden.

Feedback van de gemeenschap en de reactie van Baidu

Na de lancering van ERNIE 5.0 heeft ontwikkelaar en AI-evaluator Lisan al Gaib (@scaling01) plaatste een gemengde recensie op X. Hoewel ze aanvankelijk onder de indruk waren van de benchmarkprestaties van het model, meldden ze een aanhoudend probleem waarbij ERNIE 5.0 herhaaldelijk tools aanriep (zelfs als er expliciet werd opgedragen dat niet te doen) tijdens het genereren van SVG-taken.

“ERNIE 5.0 benchmarks zagen er waanzinnig uit totdat ik het testte… helaas is het RL hersenbeschadigd of hebben ze een ernstig probleem met hun chatplatform/systeemprompt”, schreef Lisan.

Binnen enkele uren zal Baidu’s op ontwikkelaars gerichte ondersteuningsaccount, @ErnieforDevs, heeft gereageerd:

“Bedankt voor de feedback! Het is een bekende bug; bepaalde syntaxis kan deze consistent activeren. We werken aan een oplossing. Je kunt proberen de prompt opnieuw te formuleren of te wijzigen om deze voorlopig te vermijden.”

De snelle ommekeer weerspiegelt de toenemende nadruk van Baidu op communicatie met ontwikkelaars, vooral omdat het internationale gebruikers bevoordeelt via zowel propriëtaire als open source-aanbiedingen.

Vooruitzichten voor Baidu en zijn fundamentele LLM-familie ERNIE

Baidu’s ERNIE 5.0 markeert een strategische escalatie in de wereldwijde race naar funderingsmodellen. Met prestatieclaims die het op één lijn stellen met de meest geavanceerde systemen van OpenAI en Google, en een mix van premium prijzen en open-access alternatieven, geeft Baidu blijk van zijn ambitie om niet alleen een binnenlandse AI-leider te worden, maar een geloofwaardige mondiale infrastructuuraanbieder.

In een tijd waarin zakelijke AI-gebruikers steeds meer multimodale prestaties, flexibele licenties en implementatie-efficiëntie eisen, kan Baidu’s tweesporenaanpak – premium gehoste API’s en open-source releases – de aantrekkingskracht ervan vergroten binnen zowel bedrijfs- als ontwikkelaarsgemeenschappen.

Of de prestatieclaims van het bedrijf stand houden bij tests door derden valt nog te bezien. Maar in een landschap dat wordt gevormd door stijgende kosten, complexiteit van modellen en computerknelpunten, geven ERNIE 5.0 en het ondersteunende ecosysteem Baidu een concurrentiepositie in de volgende golf van AI-implementatie.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in