# mitigation
8 artikelengetagd met “mitigation”
Assessment van verdediging en mitigatie
Assessment covering guardrails, classifiers, constitutional AI, and defense-in-depth architectures.
Adversarial training voor LLM-verdediging
Gebruik adversarial-trainingstechnieken om de robuustheid van LLM's tegen bekende aanvalspatronen te verbeteren.
Circuit-breakerpatronen voor LLM's
Implementeer circuit-breakerpatronen die LLM-verwerking stilleggen wanneer afwijkend gedrag wordt gedetecteerd.
Verdediging & mitigatie
Defensieve strategieën voor AI-systemen waaronder guardrails-architectuur, monitoring en observability, veilige ontwikkelpraktijken, remediatiemapping en geavanceerde verdedigingstechnieken.
Privilegescheiding in LLM-applicaties
Implementeer privilegescheiding om de mogelijkheden die voor de LLM beschikbaar zijn te beperken op basis van context en gebruikersrol.
Canariesysteem voor prompt-injectie
Zet canariestrings in systeemprompts in om pogingen tot prompt-injectie en extractie te detecteren en erop te alarmeren.
Consistentiecontrole van responses
Implementeer consistentiecontrole tussen modelresponses en bekende feiten om manipulatie te detecteren.
Token-attributiemonitoring
Monitor token-attributies in modeluitvoer om kwaadaardige beïnvloeding van de generatie te detecteren.