# mitigation

標記為「mitigation」的 16 篇文章

Defense & Mitigation Assessment

Assessment covering guardrails, classifiers, constitutional AI, and defense-in-depth architectures.

assessmentsdefensemitigationexam

中級

Adversarial Training for LLM Defense

Use adversarial training techniques to improve LLM robustness against known attack patterns.

mitigationtrainingadversarialdefense

進階

Circuit Breaker Patterns for LLMs

Implement circuit breaker patterns that halt LLM processing when anomalous behavior is detected.

mitigationdefensellmbreakerpatternscircuit

中級

Defense & Mitigation

Defensive strategies for AI systems including guardrails architecture, monitoring and observability, secure development practices, remediation mapping, and advanced defense techniques.

defensemitigationguardrailsmonitoringsecure-developmentremediation

入門

Privilege Separation in LLM Applications

Implement privilege separation to limit the capabilities available to the LLM based on context and user role.

separationmitigationdefensellmprivilegeapps

中級

Prompt Injection Canary System

Deploy canary strings in system prompts to detect and alert on prompt injection and extraction attempts.

mitigationdefenseinjectioncanarypromptsystem

中級

Response Consistency Checking

Implement consistency checking between model responses and known facts to detect manipulation.

mitigationcheckingdefenseconsistencyresponse

中級

Token Attribution Monitoring

Monitor token attributions in model outputs to detect adversarial influence on generation.

mitigationdefensemonitoringtokenattribution

進階

防禦 & Mitigation 評量

評量 covering guardrails, classifiers, constitutional AI, and defense-in-depth architectures.