Home Nieuws Cohere’s Rerank 4 verviervoudigt het contextvenster met meer dan 3,5 om agentfouten...

Cohere’s Rerank 4 verviervoudigt het contextvenster met meer dan 3,5 om agentfouten te verminderen en de nauwkeurigheid van enterprise search te vergroten

2
0
Cohere’s Rerank 4 verviervoudigt het contextvenster met meer dan 3,5 om agentfouten te verminderen en de nauwkeurigheid van enterprise search te vergroten

Bijna een jaar na de release Herschikking 3.5heeft Cohere de nieuwste versie van zijn zoekmodel gelanceerd, nu met een groter contextvenster om agenten te helpen de informatie te vinden die ze nodig hebben om hun taken te voltooien.

zei Cohere een blogpost dat Rerank 4 een contextvenster van 32K heeft, wat een viervoudige toename betekent vergeleken met 3.5.

“Hierdoor kan het model langere documenten verwerken, meerdere passages tegelijkertijd evalueren en relaties tussen secties vastleggen die kortere vensters zouden missen”, aldus de blogpost. “Deze uitgebreide capaciteit verbetert daarom de rangschikkingsnauwkeurigheid voor realistische documenttypen en vergroot het vertrouwen in de relevantie van de opgehaalde resultaten.”

Rerank 4 is verkrijgbaar in twee smaken: Fast en Pro. Als kleiner model is Fast het meest geschikt voor gebruiksscenario’s die zowel snelheid als nauwkeurigheid vereisen, zoals e-commerce, programmeren en klantenservice. Pro is geoptimaliseerd voor taken die een diepere redenering, precisie en analyse vereisen, zoals het genereren van risicomodellen en het uitvoeren van gegevensanalyses.

Enterprise-zoekopdracht groter belang gekregen dit jaar, vooral omdat AI-agenten toegang moeten krijgen tot meer informatie en context over de organisatie waarvoor ze werken. Cohere zei dat rerankers “de nauwkeurigheid van zakelijke AI-zoekopdrachten aanzienlijk vergroten door de initiële ophaalresultaten te verfijnen.” Rerank 4 pakt de nuancekloof aan die is ontstaan ​​door sommige bi-encoder-inbeddingsmodellen – modellen die het ophalen van augmented generatie (RAG)-taken eenvoudiger maken – door gebruik te maken van een cross-encoder-architectuur “die zoekopdrachten en kandidaten gezamenlijk verwerkt, subtiele semantische relaties vastlegt en de resultaten herschikt om de meest relevante items naar boven te halen”, aldus Cohere.

Prestaties en benchmarks

Cohere heeft de modellen vergeleken met andere herrangschikkingsmodellen, zoals Qwen Reranker 8B, Jina Rerank v3 van Elasticsearch en MongoDB’s Voyage Rerank 2.5, voor taken in de financiële, gezondheidszorg- en productiedomeinen. Rerank 4 presteerde sterk, zo niet beter dan zijn concurrenten.

Rerank 3.5 viel op vanwege het vermogen om meerdere talen te ondersteunen, en Cohere zei dat Rerank 4 deze trend voortzet. Het begrijpt meer dan 100 talen, inclusief ultramoderne opvraging in 10 grote zakelijke talen.

Agenten en herrangschikkingsmodellen

Rerank 4 heeft tot doel agentische taken te laten begrijpen welke gegevens het meest geschikt zijn voor hun taken en om meer context te bieden.

Cohere merkte op dat het model een sleutelcomponent is van zijn werking AI-platform, Noordomdat het “naadloos integreert in bestaande AI-zoekoplossingen, inclusief hybride, vector- en trefwoordgebaseerde systemen, met minimale codewijzigingen.”

Naarmate meer bedrijven middelen willen gebruiken voor onderzoek en inzichten, zoals blijkt uit de opkomst van Deep Research-functiesworden modellen die irrelevante inhoud helpen filteren, zoals rerankers, steeds belangrijker.

“Dit heeft vooral impact op agentische AI, waar complexe, uit meerdere stappen bestaande interacties snel modeloproepen kunnen stimuleren en contextvensters kunnen verzadigen”, aldus Cohere.

Het bedrijf beweert dat Rerank 4 het tokengebruik helpt verminderen en het aantal nieuwe pogingen dat een agent nodig heeft om de zaken goed te krijgen, door te voorkomen dat informatie van lage kwaliteit de LLM bereikt.

Zelflerend

Cohere zei dat Rerank 4 niet alleen opvalt door zijn sterke herrangschikkingsmogelijkheden, maar ook omdat het het eerste herrangschikkingsmodel is dat zichzelf leert.

Gebruikers kunnen Rerank 4 aanpassen voor gebruiksscenario’s die ze vaker tegenkomen, zonder aanvullende geannoteerde gegevens. Net zoals foundationmodellen zoals GPT-5.2waar mensen voorkeuren kunnen aangeven en het model deze onthoudt, kunnen Rerank 4-gebruikers het model hun favoriete inhoudstypen en documentcorpora vertellen.

Als het model bijvoorbeeld wordt gebruikt met Rerank 4 Fast, wordt het concurrerender met grotere modellen omdat het nauwkeuriger is en gebruikmaakt van specifieke gegevens die gebruikers willen.

“Als we verder keken, hebben we ook onderzocht hoe het zelflerende vermogen van Rerank 4 presteert op geheel nieuwe zoekdomeinen”, aldus Cohere. “Door gebruik te maken van op de gezondheidszorg gerichte datasets die de behoefte van een arts nabootsen om patiëntspecifieke informatie op te halen (niet alleen de expertise uit een bepaalde medische discipline), ontdekten we dat het inschakelen van zelfleren consistente, substantiële winsten opleverde. Het resultaat: een duidelijke en significante verbetering in de ophaalkwaliteit voor Rerank 4 Fast, over de hele linie.”

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in