Home Nieuws Hoe Kimi K2.5 van Moonshot AI-bouwers helpt om gemakkelijker dan ooit agentenzwermen...

Hoe Kimi K2.5 van Moonshot AI-bouwers helpt om gemakkelijker dan ooit agentenzwermen op te zetten

2
0
Hoe Kimi K2.5 van Moonshot AI-bouwers helpt om gemakkelijker dan ooit agentenzwermen op te zetten

Het Chinese bedrijf Moonshot AI heeft zijn systeem geüpgraded open source Kimi K2-modelen transformeert het in een coderings- en visiemodel met een architectuur die de orkestratie van een agentenzwerm ondersteunt.

Het nieuwe model, Moonshot Kimi K2.5, is een goede optie voor bedrijven die agenten willen die automatisch acties kunnen doorgeven in plaats van dat een raamwerk een centrale besluitvormer is.

Het bedrijf typeerde Kimi K2.5 als een “alles-in-één model” dat zowel visuele als tekstinvoer ondersteunt, waardoor gebruikers het model kunnen gebruiken voor meer visuele codeerprojecten.

Moonshot heeft het aantal parameters van K2.5 niet publiekelijk bekendgemaakt, maar het Kimi K2-model waarop het is gebaseerd, had in totaal 1 biljoen parameters en 32 miljard geactiveerde parameters dankzij de mix van experts-architectuur.

Dit is het nieuwste open-sourcemodel dat een alternatief biedt voor de meer gesloten opties van Google, OpenAI en Anthropic, en het presteert beter dan deze op belangrijke statistieken, waaronder agentische workflows, codering en visie.

Op de Het laatste examen van de mensheid (HLE) benchmark scoorde Kimi K2.5 50,2% (met tools), overtreft OpenAI’s GPT-5.2 (xhigh) en Claude Opus 4.5. Het is ook gelukt 76,8% op SWE-bank geverifieerdwaarmee zijn status als codeermodel van het hoogste niveau wordt bevestigd, hoewel GPT-5.2 en Opus 4.5 het hier inhalen op respectievelijk 80 en 80.9.

Kimi K2.5 Thinking benchmark-vergelijkingstabel. Krediet: Moonshot AI

Moonshot zei in een persbericht dat het aantal gebruikers tussen september en november met 170% is gestegen voor Kimi K2 en Kimi K2 Denktdie begin november werd uitgebracht.

Agentenzwerm en ingebouwde orkestratie

Moonshot streeft ernaar om gebruik te maken van zelfgestuurde agenten en het agentenzwermparadigma dat is ingebouwd in Kimi K2.5. Agentenzwerm wordt aangeprezen als de volgende grens in de ontwikkeling van zakelijke AI en agent-gebaseerde systemen. Het heeft de afgelopen maanden veel aandacht getrokken.

Voor ondernemingen betekent dit dat als ze agent-ecosystemen bouwen met Kimi K2.5, ze efficiënter kunnen opschalen. Maar in plaats van het ‘opschalen’ of vergroten van de modelgroottes om grotere agenten te creëren, gokt het bedrijf op het maken van meer agenten die zichzelf in wezen kunnen orkestreren.

Kimi K2.5 “creëert en coördineert een zwerm gespecialiseerde agenten die parallel werken.” Het bedrijf vergeleek het met een bijenkorf waarbij elke agent een taak uitvoert en tegelijkertijd bijdraagt ​​aan een gemeenschappelijk doel. Het model leert maximaal 100 subagenten zelf aan te sturen en kan parallelle workflows van maximaal 1.500 tooloproepen uitvoeren.

“Benchmarks vertellen slechts de helft van het verhaal. Moonshot AI is van mening dat AGI uiteindelijk moet worden beoordeeld op zijn vermogen om taken in de echte wereld efficiënt uit te voeren onder reële tijdsbeperkingen. De echte maatstaf waar ze om geven is: hoeveel van je dag heeft AI je daadwerkelijk teruggegeven? Door parallel te draaien, wordt de tijd die nodig is voor een complexe taak aanzienlijk verminderd – taken die nu dagen werk vergen, kunnen in enkele minuten worden uitgevoerd”, aldus het bedrijf.

Bedrijven die nadenken over hun orkestratiestrategieën zijn gaan kijken naar agentische platforms waarop agenten communiceren en taken doorgeven, in plaats van een rigide orkestratieraamwerk te volgen dat dicteert wanneer een actie is voltooid.

Hoewel Kimi K2.5 een aantrekkelijke optie kan bieden voor organisaties die deze vorm van orkestratie willen gebruiken, voelen sommigen zich misschien meer op hun gemak bij het vermijden van op agenten gebaseerde orkestratie in het model ingebakken en in plaats daarvan een ander platform gebruikt om de modeltraining te onderscheiden van de agenttaak.

Dit komt omdat bedrijven vaak meer flexibiliteit willen in de modellen waaruit hun agenten bestaan, zodat ze een ecosysteem van agenten kunnen opbouwen die gebruikmaken van LLM’s die het beste werken voor specifieke acties.

Sommige agentplatforms, zoals Salesforce, AWS Bedrock en IBM, bieden afzonderlijke tools voor observatie, beheer en monitoring waarmee gebruikers AI-agents kunnen orkestreren die met verschillende modellen zijn gebouwd en hen in staat stellen samen te werken.

Multimodale codering en visuele foutopsporing

Met het model kunnen gebruikers visuele lay-outs coderen, inclusief gebruikersinterfaces en interacties. Het redeneert over afbeeldingen en video’s om taken te begrijpen die zijn gecodeerd in visuele invoer. K2.5 kan bijvoorbeeld de code van een website reconstrueren door simpelweg een video-opname van de site in actie te analyseren en visuele aanwijzingen te vertalen naar interactieve lay-outs en animaties.

“Interfaces, lay-outs en interacties die moeilijk precies in taal te beschrijven zijn, kunnen worden gecommuniceerd via schermafbeeldingen of schermopnames, die het model kan interpreteren en omzetten in volledig functionele websites. Dit maakt een nieuwe klasse van sfeercoderingservaringen mogelijk”, aldus Moonshot.

Deze mogelijkheid is geïntegreerd in Kimi Code, een nieuwe terminalgebaseerde tool die werkt met IDE’s zoals VSCode en Cursor.

Het ondersteunt ‘autonome visuele debugging’, waarbij het model zijn eigen uitvoer visueel inspecteert (zoals een gerenderde webpagina), naar documentatie verwijst en de code herhaalt om lay-outverschuivingen of esthetische fouten op te lossen zonder menselijke tussenkomst.

In tegenstelling tot andere multimodale modellen die afbeeldingen kunnen creëren en begrijpen, kan Kimi K2.5 frontend-interacties voor websites bouwen met beeldmateriaal, en niet alleen met de code erachter.

API-prijzen

Moonshot AI heeft de K2.5 API agressief geprijsd om te concurreren met grote Amerikaanse laboratoria, wat aanzienlijke kortingen biedt in vergelijking met het vorige K2 Turbo-model.

  • Invoer: 60 cent per miljoen tokens (a 47,8% afname).

  • Gecachte invoer: 10 cent per miljoen tokens (a 33,3% afname).

  • Uitgang: $3 per miljoen tokens (a 62,5% afname).

De lage kosten van in de cache opgeslagen invoer ($0,10/M tokens) zijn vooral relevant voor de “Agent Swarm”-functies, die vaak het onderhouden van grote contextvensters over meerdere subagenten en uitgebreid gebruik van tools vereisen.

Gewijzigde MIT-licentie

Hoewel Kimi K2.5 open source is, wordt het vrijgegeven onder een gewijzigde MIT-licentie die een specifieke clausule bevat die gericht is op “hyperscale” commerciële gebruikers.

De licentie verleent standaardmachtigingen voor het gebruiken, kopiëren, wijzigen en verkopen van de software.

Het bepaalt echter dat als de software of enig afgeleid werk wordt gebruikt voor een commercieel product of dienst met meer dan 100 miljoen maandelijkse actieve gebruikers (MAU) of meer dan $20 miljoen USD aan maandelijkse inkomsten, de entiteit “Kimi K2.5” prominent moet weergeven op de gebruikersinterface.

Deze clausule zorgt ervoor dat, hoewel het model gratis en open blijft voor de overgrote meerderheid van de ontwikkelaarsgemeenschap en startups, grote technologiegiganten de technologie van Moonshot niet kunnen whitelabelen zonder zichtbare attributie te bieden.

Het is niet volledig “open source”, maar het is beter dan het vergelijkbare van Meta Lama Licentievoorwaarden vanwege zijn ‘open source’-familie van modellen, waarbij bedrijven met 700 miljoen of meer maandelijkse gebruikers een speciale bedrijfslicentie van het bedrijf moesten verkrijgen.

Wat het betekent voor moderne AI-bouwers van ondernemingen

Voor de beoefenaars die de moderne AI-stack definiëren – van LLM-beslissers die implementatiecycli optimaliseren tot AI-orkestratieleiders die agenten en AI-aangedreven geautomatiseerde bedrijfsprocessen opzetten – vertegenwoordigt Kimi K2.5 een fundamentele verschuiving in de hefboomwerking.

Door zwermorkestratie rechtstreeks in het model in te bedden, geeft Moonshot AI deze bouwers met beperkte middelen effectief een synthetisch personeelsbestand, waardoor een enkele ingenieur honderd autonome sub-agenten net zo gemakkelijk kan aansturen als een enkele prompt.

Deze ‘scale-out’-architectuur pakt direct het dilemma van databeslissers aan om complexe pijpleidingen in evenwicht te brengen met een beperkt personeelsbestand, terwijl de verlaagde prijsstructuur dataverwerking met hoge context transformeert van een budgetbrekende luxe in een routineproduct.

Uiteindelijk suggereert K2.5 een toekomst waarin de belangrijkste beperking voor een technisch team niet langer het aantal handen op de toetsenborden is, maar het vermogen van de leiders om een ​​zwerm te choreograferen.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in