Home Nieuws Claude 4.5 van Anthropic verslaat elk mens tijdens een twee uur durende...

Claude 4.5 van Anthropic verslaat elk mens tijdens een twee uur durende technische test

1
0
Claude 4.5 van Anthropic verslaat elk mens tijdens een twee uur durende technische test

Het nieuwe AI-model van Anthropic presteert beter dan mensen op het gebied van coderen, zei het bedrijf over zijn nieuwste release.

Maandag maakte het bedrijf bekend Sluit werk 4.5 en beschreef het als het meest geavanceerde AI-model tot nu toe, en zei dat het nieuwe model “hoger scoorde dan welke menselijke kandidaat ooit” op “een notoir moeilijk take-home-examen” dat het bedrijf aan potentiële technische kandidaten geeft.

In een blogpost op maandag zei Anthropic dat de twee uur durende take-home-test is ontworpen om de technische bekwaamheid en het beoordelingsvermogen onder tijdsdruk te beoordelen, en hoewel deze niet alle vaardigheden weerspiegelt die een ingenieur moet bezitten, roept het feit dat een AI-model “sterke kandidaten over belangrijke technische vaardigheden overtreft” vragen op over “hoe AI de techniek als beroep zal veranderen.”

In zijn methodologie zei het bedrijf dat dit resultaat voortkwam uit het geven van verschillende kansen aan het model om elk probleem op te lossen en vervolgens het beste antwoord te kiezen.

Er is niet veel publiekelijk bekende informatie over waar de technische test uit bestaat. In een interviewrecensie uit 2024, gepubliceerd op Glassdoor, staat dat de test vier niveaus heeft en potentiële kandidaten wordt gevraagd een specifiek systeem te implementeren en er functionaliteiten aan toe te voegen. Het is onduidelijk of de test die Claude 4.5 kreeg, vergelijkbaar was. Anthropic heeft geen verdere details verstrekt in zijn blog en heeft niet gereageerd op een verzoek om commentaar.

De nieuwste uitgave van Claude 4.5 komt slechts drie maanden na de uitrol van de vorige editie. Naast coderen heeft het nieuwe model ook upgrades voor het genereren van professionele documenten, waaronder Excel-spreadsheets en PowerPoint-presentaties.

De nieuwe release blijft die van Anthropic versterken dominantie in AI-codering. Zelfs Meta van Mark Zuckerberg gebruikt Claude om zijn verhaal te ondersteunen Devmate interne codeerassistent ondanks dat ze rivalen zijn in de AI-race.

Het bedrijf heeft zijn trainingsmethoden geheim gehouden. Erik Simonsde CEO van Stackblitz, de startup achter de vibe-coderingsservice Bolt.new, vertelde Business Insider eerder dat hij gelooft dat Anthropic zijn AI-modellen zelf code heeft laten schrijven en lanceren, waarna het bedrijf de resultaten heeft beoordeeld met behulp van zowel mensen als AI-tools. Dianne Penn, hoofd Product Management, Research and Frontiers bij Anthropic, zei dat deze beschrijving “over het algemeen waar” was.

In oktober, Antropische CEO Dario Amodei zei op de Dreamforce-conferentie dat Claude AI al 90% van de code schrijft voor de meeste teams van het bedrijf, hoewel hij geen enkele software-ingenieur door de bot zou vervangen.

‘Als Claude schrijft 90% van de codeWat dat meestal betekent, is dat je net zoveel software-ingenieurs nodig hebt. Misschien heb je meer nodig, omdat ze dan een grotere invloed kunnen hebben”, aldus Amodei. “Ze kunnen zich concentreren op de 10% die de code bewerkt, of de 10% schrijft die het moeilijkst is, of toezicht houden op een groep AI-modellen.”



Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in