Home Nieuws Het AI-beveiligingsteam van Microsoft onthult hoe verborgen achterdeurtjes voor trainingen stilletjes overleven...

Het AI-beveiligingsteam van Microsoft onthult hoe verborgen achterdeurtjes voor trainingen stilletjes overleven in bedrijfstaalmodellen

5
0
Het AI-beveiligingsteam van Microsoft onthult hoe verborgen achterdeurtjes voor trainingen stilletjes overleven in bedrijfstaalmodellen


  • Microsoft lanceert een scanner om vergiftigde taalmodellen te detecteren vóór implementatie
  • Backdoored LLM’s kunnen kwaadaardig gedrag verbergen totdat specifieke triggerzinnen verschijnen
  • De scanner identificeert abnormale aandachtspatronen die verband houden met verborgen achterdeurtriggers

Microsoft heeft de ontwikkeling aangekondigd van een nieuwe scanner die is ontworpen om verborgen achterdeurtjes te detecteren in open-weight grote taalmodellen die in bedrijfsomgevingen worden gebruikt.

Het bedrijf zegt dat zijn tool tot doel heeft gevallen van modelvergiftiging te identificeren, een vorm van knoeien waarbij kwaadaardig gedrag tijdens de training rechtstreeks in modelgewichten wordt ingebed.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in