Home Nieuws OpenAI upgradet zijn Responses API om agentvaardigheden en een complete terminalshell te...

OpenAI upgradet zijn Responses API om agentvaardigheden en een complete terminalshell te ondersteunen

5
0
OpenAI upgradet zijn Responses API om agentvaardigheden en een complete terminalshell te ondersteunen

Tot voor kort leek de praktijk van het bouwen van AI-agenten een beetje op het trainen van een langeafstandsloper met een geheugen van dertig seconden.

Ja, je zou je AI-modellen hulpmiddelen en instructies kunnen geven, maar na enkele tientallen interacties – een aantal ronden op het circuit, om onze hardloopanalogie uit te breiden – zou het onvermijdelijk de context verliezen en gaan hallucineren.

Met De nieuwste updates van OpenAI naar zijn Reacties-API – de applicatieprogrammeerinterface waarmee ontwikkelaars op het OpenAI-platform met één enkele oproep toegang kunnen krijgen tot meerdere agentische tools, zoals zoeken op internet en bestanden zoeken – het bedrijf geeft aan dat het tijdperk van de beperkte agent aan het afnemen is.

De vandaag aangekondigde updates omvatten Server-side Compaction, Hosted Shell Containers en een nieuwe “Vaardigheden“standaard voor agenten.

Met deze drie grote updates geeft OpenAI agenten feitelijk een vast bureau, een terminal en een geheugen dat niet vervaagt en dat agenten moet helpen zich verder te ontwikkelen tot betrouwbare digitale werkers voor de lange termijn.

Technologie: ‘contextgeheugenverlies’ overwinnen

De belangrijkste technische hindernis voor autonome agenten is altijd de ‘rommel’ van langlopende taken geweest. Elke keer dat een agent een tool aanroept of een script uitvoert, groeit de gespreksgeschiedenis.

Uiteindelijk bereikt het model zijn tokenlimiet en wordt de ontwikkelaar gedwongen de geschiedenis in te korten, waarbij vaak juist de ‘redenering’ wordt verwijderd die de agent nodig heeft om de klus te klaren.

Het antwoord van OpenAI is server-side compactie. In tegenstelling tot eenvoudige truncatie, zorgt compactie ervoor dat agenten uren of zelfs dagen kunnen werken.

Vroege gegevens van e-commerceplatform Drievoudige Walvis suggereert dit is een doorbraak in stabiliteit: hun agent, Moby, navigeerde met succes door een sessie met 5 miljoen tokens en 150 tooloproepen zonder dat de nauwkeurigheid daalde.

In praktische termen betekent dit dat het model zijn eigen acties uit het verleden kan ‘samenvatten’ in een gecomprimeerde staat, waardoor de essentiële context levend blijft en de ruis wordt weggenomen. Het transformeert het model van een vergeetachtige assistent in een volhardend systeemproces.

Beheerde cloud-sandboxen

Met de introductie van de Shell Tool begeeft OpenAI zich naar het domein van managed computing. Ontwikkelaars kunnen nu kiezen voor container_auto, die een door OpenAI gehoste Debian 12-omgeving biedt.

Dit is niet zomaar een code-interpreter: het geeft elke agent zijn eigen volledige terminalomgeving, vooraf geladen met:

  • Native uitvoeringsomgevingen inclusief Python 3.11, Node.js 22, Java 17, Go 1.23 en Ruby 3.1.

  • Aanhoudende opslag via /mnt/datawaardoor agenten artefacten kunnen genereren, opslaan en downloaden.

  • Netwerkmogelijkheden waarmee agenten verbinding kunnen maken met internet om bibliotheken te installeren of te communiceren met API’s van derden.

De Hosted Shell en zijn persistentie /mnt/data storage biedt een beheerde omgeving waarin agenten complexe datatransformaties kunnen uitvoeren met behulp van Python of Java zonder dat het team voor elk AI-project aangepaste ETL-middleware (Extract, Transform, Load) hoeft te bouwen en te onderhouden.

Door gebruik te maken van deze gehoste containers kunnen data-ingenieurs hoogwaardige gegevensverwerkingstaken implementeren en tegelijkertijd de ‘meerdere verantwoordelijkheden’ minimaliseren die gepaard gaan met het beheren van op maat gemaakte infrastructuur, waardoor de overhead van het bouwen en beveiligen van hun eigen sandboxes wordt weggenomen. OpenAI zegt in essentie: “Geef ons de instructies; wij zorgen voor de computer.”

De vaardigheden van OpenAI versus de vaardigheden van Anthropic

Terwijl OpenAI op weg is naar een uniforme agent-orkestratiestack, wordt het geconfronteerd met een aanzienlijke filosofische uitdaging van Anthropic’s Agent Skills.

Beide bedrijven zijn geconvergeerd naar een opmerkelijk vergelijkbare bestandsstructuur – met behulp van a SKILL.md (markdown) manifesteren zich met YAML-frontmaterie – maar hun onderliggende strategieën onthullen uiteenlopende visies op de toekomst van werk.

De aanpak van OpenAI geeft prioriteit aan een “programmeerbaar substraat” dat is geoptimaliseerd voor de snelheid van ontwikkelaars. Door de shell, het geheugen en de vaardigheden in de Responses API te bundelen, bieden ze een kant-en-klare ervaring voor het snel bouwen van complexe agenten.

Er is al een AI-zoekopdracht voor ondernemingen gestart Verzamel rapporteerde een sprong in de gereedschapsnauwkeurigheid van 73% naar 85% door gebruik te maken van het Skills-framework van OpenAI.

Daarentegen heeft Anthropic Agent Skills gelanceerd als een onafhankelijke open standaard (agentskills.io).

Terwijl het systeem van OpenAI nauw geïntegreerd is in de eigen cloudinfrastructuur, zijn de vaardigheden van Anthropic ontworpen voor draagbaarheid. Een vaardigheid die voor Claude is gebouwd, kan in theorie worden verplaatst naar VS Code, Cursor of elk ander platform dat de specificatie overneemt.

Inderdaad, de populaire nieuwe open source AI-agent Open Klauw precies dit overgenomen SKILL.md manifest- en mapgebaseerde verpakkingen, waardoor het een schat aan gespecialiseerde procedurele kennis kan erven die oorspronkelijk voor Claude was ontworpen.

Deze architectonische compatibiliteit heeft geleid tot een door de gemeenschap aangestuurde ‘vaardigheidsgroei’ op platforms als ClawHub, die nu meer dan 3.000 door de gemeenschap gebouwde uitbreidingen host, variërend van smart home-integraties tot complexe bedrijfsworkflowautomatiseringen.

Deze kruisbestuiving toont aan dat de “Skill” een draagbaar, versiebeheermiddel is geworden in plaats van een door de leverancier vergrendelde functie. Omdat OpenClaw meerdere modellen ondersteunt, waaronder OpenAI’s GPT-5-serie en lokale Llama-instanties, kunnen ontwikkelaars nu een vaardigheid één keer schrijven en deze inzetten in een heterogeen landschap van agenten.

Voor technische besluitvormers wordt deze open standaard de voorkeursmanier van de sector om ‘agentische kennis’ te externaliseren en te delen, waarbij de propriëtaire aanwijzingen worden achterwege gelaten in de richting van een gedeelde, inspecteerbare en interoperabele infrastructuur.

Maar er is nog een belangrijk onderscheid tussen de ‘vaardigheden’ van OpenAI en Anthropic.

OpenAI maakt gebruik van Server-side Compaction om de actieve status van een langlopende sessie te beheren. Anthropic maakt gebruik van Progressive Disclosure, een systeem met drie niveaus waarbij het model in eerste instantie alleen kennis heeft van de namen en beschrijvingen van vaardigheden.

Volledige details en hulpscripts worden alleen geladen als de taak dit specifiek vereist. Hierdoor kunnen enorme vaardigheidsbibliotheken – merkrichtlijnen, juridische checklists en codesjablonen – bestaan ​​zonder het werkgeheugen van het model te overweldigen.

Implicaties voor technische besluitvormers in ondernemingen

Voor ingenieurs die zich richten op “snelle implementatie en afstemming”, biedt de combinatie van server-side compaction en skills een enorme productiviteitsboost

In plaats van aangepast statusbeheer te bouwen voor elke agent die wordt uitgevoerd, kunnen ingenieurs ingebouwde compactie gebruiken om taken van meerdere uren af ​​te handelen.

Vaardigheden maken ‘verpakte IP’ mogelijk, waarbij specifieke verfijning of gespecialiseerde procedurele kennis kan worden gemodulariseerd en hergebruikt in verschillende interne projecten.

Voor degenen die AI van een ‘chatbox’ naar een workflow op productieniveau moeten verplaatsen: de aankondiging van OpenAI markeert het einde van het tijdperk van ‘op maat gemaakte infrastructuur’.

Historisch gezien vereiste het orkestreren van een agent aanzienlijke handmatige ondersteuning: ontwikkelaars moesten aangepaste logica voor statusbeheer bouwen om lange gesprekken af ​​te handelen en veilige, kortstondige sandboxes om code uit te voeren.

De uitdaging is niet langer: “Hoe geef ik deze agent een terminal?” maar “Welke vaardigheden zijn geautoriseerd voor welke gebruikers?” en “Hoe controleren we de artefacten die in het gehoste bestandssysteem worden geproduceerd?” OpenAI heeft de motor en het chassis geleverd; Het is nu de taak van de orkestrator om de verkeersregels te definiëren.

Voor managers van beveiligingsoperaties (SecOps) is het een ontwikkeling met grote inzet om een ​​AI-model een shell- en netwerktoegang te geven. OpenAI’s gebruik van domeingeheimen en organisatietoelatingslijsten biedt een diepgaande verdedigingsstrategie, die ervoor zorgt dat agenten API’s kunnen aanroepen zonder ruwe inloggegevens bloot te stellen aan de context van het model.

Maar nu agenten gemakkelijker kunnen worden ingezet via ‘Skills’, moet SecOps waakzaam zijn over ‘kwaadaardige vaardigheden’ die snelle injectiekwetsbaarheden of ongeoorloofde data-exfiltratiepaden kunnen introduceren.

Hoe moeten bedrijven beslissen?

OpenAI verkoopt niet langer alleen maar een ‘brein’ (het model); het verkoopt het ‘kantoor’ (de container), het ‘geheugen’ (verdichting) en het ‘trainingshandboek’ (vaardigheden). Voor bedrijfsleiders wordt de keuze duidelijk:

  • Kies OpenAI als u een geïntegreerde, snelle omgeving nodig heeft voor langdurig autonoom werk.

  • Kies Anthropic als uw organisatie model-agnostische portabiliteit en een open ecosysteemstandaard vereist.

Uiteindelijk geven de aankondigingen aan dat AI zich uit de chatbox verplaatst naar de systeemarchitectuur, waardoor ‘prompt spaghetti’ wordt omgezet in onderhoudbare, versiebeheerde en schaalbare zakelijke workflows.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in