# GCG
4 artikelengetagd met “GCG”
Universele adversarial aanvallen
Universele perturbaties die overdraagbaar zijn tussen modellen, onderzoek naar adversarial suffixen en technieken om modelonafhankelijke aanvalspayloads te maken.
universal-attacksadversarial-perturbationstransferabilitymodel-agnosticGCG
Generatie van adversarial suffixes
GCG-aanvallen, universele adversarial triggers, soft prompt-optimalisatie en technieken om verdedigingen te ontwijken voor geautomatiseerde alignment-bypass.
GCGadversarial-suffixesuniversal-triggerssoft-promptsoptimization
Lab: optimalisatie van adversarial suffixes
Implement GCG-style adversarial suffix attacks that automatically discover token sequences causing language models to comply with harmful requests. Covers gradient-based optimization, transferability analysis, and defense evaluation.
labexpertadversarial-suffixGCGoptimizationhands-on
Adversarial aanvallen op tokenniveau
Gradient-gebaseerde optimalisatie en tokenmanipulatie gebruiken om adversarial suffixen te ontdekken die betrouwbaar onveilig modelgedrag uitlokken.
prompt-injectiontokensadversarialGCG