# GCG

4 artikelengetagd met “GCG”

Universele adversarial aanvallen

Universele perturbaties die overdraagbaar zijn tussen modellen, onderzoek naar adversarial suffixen en technieken om modelonafhankelijke aanvalspayloads te maken.

universal-attacksadversarial-perturbationstransferabilitymodel-agnosticGCG

Expert

Generatie van adversarial suffixes

GCG-aanvallen, universele adversarial triggers, soft prompt-optimalisatie en technieken om verdedigingen te ontwijken voor geautomatiseerde alignment-bypass.

GCGadversarial-suffixesuniversal-triggerssoft-promptsoptimization

Expert

Lab: optimalisatie van adversarial suffixes

Implement GCG-style adversarial suffix attacks that automatically discover token sequences causing language models to comply with harmful requests. Covers gradient-based optimization, transferability analysis, and defense evaluation.

labexpertadversarial-suffixGCGoptimizationhands-on

Expert

Adversarial aanvallen op tokenniveau

Gradient-gebaseerde optimalisatie en tokenmanipulatie gebruiken om adversarial suffixen te ontdekken die betrouwbaar onveilig modelgedrag uitlokken.

prompt-injectiontokensadversarialGCG

Gevorderd