# transfer-attacks

6 articlestagged with “transfer-attacks”

Lab: Cross-Lingual Transfer Attacks

Develop attacks in one language that transfer to others by exploiting shared multilingual representation spaces.

labscross-lingualtransfer-attacksadvanced

Lab: Cross-Model Transfer Attacks

Test whether jailbreaks discovered on one language model transfer effectively to others, building a systematic methodology for cross-model vulnerability research.

labcross-modeltransfer-attacksmulti-model

Advanced

Lab: Transfer Attack Development

Hands-on lab for crafting adversarial prompts on open-weight models like Llama that transfer to closed-source models like Claude and GPT-4, using iterative refinement and cross-model evaluation.

labtransfer-attackscross-modeladversarialadvanced

Advanced

Lab: Transfer Attack Development (Advanced Lab)

Develop adversarial attacks on open-source models that transfer to closed-source models, leveraging weight access for black-box exploitation.

labtransfer-attacksadversarialcross-modeladvancedhands-on

Advanced

Jailbreak Portability

Analysis of which jailbreaks transfer across models and why, including universal vs model-specific techniques, transfer attack methodology, and factors that determine portability.

jailbreakportabilitytransfer-attackscross-modeluniversalmodel-specific

Advanced

Universal Adversarial Triggers

Discovering and deploying universal adversarial trigger sequences that reliably override safety alignment across multiple LLM families, including gradient-based search, transfer attacks, and defense evasion.

prompt-injectionadversarial-triggersjailbreaktransfer-attacksred-teaming

Advanced