Anthropic lanceerde zijn nieuwste model, Claude Opus 4.5, waarmee het bedrijf weer bovenaan de benchmarkranglijst staat voor AI software codering.
Opus 4.5 scoort ruim 80% op de veelgebruikte SWE-bench, die modellen test op software-engineeringvaardigheden. GooglenDe indrukwekkende Gemini 3 Pro, die vorige week werd gelanceerd, behaalde kortstondig de topscore met 76,2%.
Anthropic’s Claude-productleider Scott White vertelt Snel bedrijf dat het model ook hoger heeft gescoord dan welk mens dan ook op de technische take-home-opdracht die het bedrijf aan technische sollicitanten geeft.
Natuurlijk doet Opus 4.5 veel meer dan coderen. Antropisch zegt dat het ook het “beste model ter wereld” is voor het aandrijven van AI-agenten en voor het besturen van een computer, en dat het aanzienlijk beter is dan andere modellen bij taken als diepgaand onderzoek en het werken met dia’s en spreadsheets.
Opus 4.5 scoorde ook state-of-the-art (beste) scores in verschillende andere belangrijke benchmarks, waaronder ‘agentic coding SWE-bench geverifieerd’, ‘agentic tool use T-2 bench’ en ‘nieuwe probleemoplossende ARC-AGI-2.’
Een grote uitdaging bij het toepassen van AI in reële werkomgevingen is het vermogen van het model om met complexiteit en ambiguïteit om te gaan. White zegt dat klanten van Anthropic vinden dat Opus 4.5 beter is dan eerdere modellen in het omgaan met onzekerheid en het omgaan met afwegingen zonder veel handwerk van menselijke werknemers.
Enterprise-klanten gebruiken steeds vaker Anthropic-modellen voor de automatisering van kantoortaken, financiële modellering en het maken van documenten, zegt White. Fundamentele Research Labs rapporteerden 20% nauwkeurigheidsverbeteringen en 15% efficiëntiewinst voor Excel-automatiseringstaken met behulp van het nieuwe model, voegt hij eraan toe.
Anthropic is de afgelopen maanden op een sprint geweest en heeft Claude Sonnet 4.5 en Haiku 4.5 uitgebracht, evenals nieuwe producten zoals Claude Skills, Claude Code en branchespecifieke versies voor financiële dienstverlening en levenswetenschappen.
Opus 4.5 wordt het nieuwe standaardmodel voor abonnees van duurdere abonnementen en zal beschikbaar zijn als vervolgkeuzemenu voor Pro-, Standard-, Team- en Enterprise-gebruikers. Het is ook beschikbaar voor ontwikkelaarsklanten via de application programming interface (API) van het bedrijf, maar ook via de Amazon Bedrock-, Google Vertex- en Microsoft Azure-clouds.
Anthropic zegt dat het ook de toegang tot een bètaversie van de Claude-plug-in uitbreidt Chroomwaarvan een beperkte preview beschikbaar is, voor alle Mac-gebruikers. Het bedrijf stelt Claude voor Excel ook in bèta beschikbaar voor Mac Team- en Enterprise-gebruikers, waarmee het verder gaat dan de eerdere onderzoekspreview op uitnodiging.



