Home Nieuws Claude Sonnet 4.6: Benchmarkprestaties, hoe u het kunt proberen

Claude Sonnet 4.6: Benchmarkprestaties, hoe u het kunt proberen

2
0
Claude Sonnet 4.6: Benchmarkprestaties, hoe u het kunt proberen

Antropisch heeft net uitgegeven het nieuwste Large Language Model (LLM), Claude Sonnett 4.6. De release van dinsdag volgt snel op de lancering van Sluit werk 4.6het premium AI-model van het bedrijf, op 5 februari.

Volgens Anthropic is “Claude Sonnet 4.6 ons meest capabele Sonnet-model tot nu toe.” Het bedrijf zegt dat Sonnet 4.6 een token van 1 miljoen heeft contextvenster in bèta. Cruciaal is dat Anthropic meldt dat Sonnet 4.6 goed presteerde bij interne veiligheidstests en een lage neiging tot hallucineren en sycofantie vertoonde.

“Sonnet 4.6 brengt veel verbeterde codeervaardigheden naar meer van onze gebruikers”, zei Anthropic, verwijzend naar de populariteit van Claude onder ontwikkelaars die AI gebruiken om te coderen.

Als je het nieuwste AI-model van Anthropic wilt gebruiken, heeft het bedrijf het heel gemakkelijk gemaakt. Zo krijgt u toegang tot Clausule Sonnet 4.6.

Claude Sonnet gebruiken 4.6

Voor zowel gratis als Pro-gebruikers is Claude Sonnett 4.6 nu als standaardmodel beschikbaar claude.ai en Claude Cowerk. Anthropic heeft het model ook uitgerold via zijn API en alle grote cloudplatforms.

Gratis gebruikers hebben beperkte gebruikstarieven die afhankelijk zijn van de huidige vraag. Limieten worden elke vijf uur opnieuw ingesteld. Voor degenen die hogere limieten nodig hebben, kost Claude Sonnet 4.6 hetzelfde prijstarief als het vorige model. Het Claude Pro-abonnement kost $ 20 per maand of $ 17 per maand als het jaarlijks wordt betaald. Als je de API gebruikt, begint Claude Sonnett 4.6 met $3 per miljoen inputtokens en $15 per miljoen outputtokens.

Claude Sonnet 4.6 benchmarkprestaties

Volgens de benchmarktests van Anthropic is Claude Sonnet 4.6 het krachtigste model van het bedrijf voor financiële analyses en kantoortaken, waarmee het concurrenten als Google’s Gemini 3 Pro en OpenAI’s GPT 5.2 verslaat.

Op deze taken verslaat Claude Sonnet 4.6 ook Anthropic’s eigen Opus 4.6, het krachtigste AI-model van Anthropic.

In de release-aankondiging zei Anthropic dat veel ontwikkelaars met vroege toegang tot Claude Sonnet 4.6 de voorkeur gaven aan het model – niet alleen boven zijn voorganger, Claude Sonnet 4.5, maar ook aan Claude Opus 4.5. Volgens de Sonnet 4.6 systeemkaartverbetert het nieuwe model op belangrijke benchmarks zoals Humanity’s Last Exam, hoewel Claude Opus 4.6 hoger scoorde.

Benchmarkprestaties

  • GPQA-diamant: 89,9 procent

  • ARC-AGI-2: 58,3 procent

  • MMMLU: 89,3 procent

  • SWE-bench Geverifieerd: 79,6 procent

  • HLE (het laatste examen van de mensheid): Met gereedschap 49,0 procent, zonder gereedschap 33,2 procent

De AI-aangedreven verzekeringsmaatschappij Pace vertelde VentureBeat dat Sonnet 4.6 het beste scoorde van alle Claude-modellen op zijn complexe benchmark voor computergebruik door verzekeringen.

Deze resultaten zijn opmerkelijk omdat de modellen van Claude Opus over het algemeen intelligenter zijn en de voorkeur verdienen voor complexe redeneringen.

Claude Sonnet 4.6 is niet alleen krachtiger dan sommige Opus-modellen, maar ook betaalbaarder. Zoals eerder vermeld, kost Claude Sonnet 4.6 $3/$15, terwijl de tarieven van Opus 4.6 $5/$25 zijn.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in