Overdraagbare aanvallen ontwikkelen
Cross-model aanvalstechnieken, overdraagbaarheid meten, ensemble-optimalisatie, en praktische methodes om transfer te testen voor AI red teams.
transferabilitycross-modeladversarialuniversal-jailbreakoptimizationllm-attacks