# trojan
4 artikelengetagd met “trojan”
Ontwerp van backdoor-triggers
Methodology for designing effective backdoor triggers for LLMs, covering trigger taxonomy, poison rate optimization, trigger-target mapping, multi-trigger systems, evaluation evasion, and persistence through fine-tuning.
Aanvallen op training en fine-tuning
Methodology for data poisoning, trojan/backdoor insertion, clean-label attacks, LoRA backdoors, sleeper agent techniques, and model merging attacks targeting the LLM training pipeline.
Op triggers gebaseerde backdoor-aanvallen
Implementing backdoor attacks using specific trigger patterns that activate pre-programmed model behavior while remaining dormant under normal conditions.
Trojan-modeldetectie
Defensiegerichte gids voor het detecteren van AI-modellen met backdoors en trojans, met BadEdit-, TrojanPuzzle- en PoisonGPT-technieken en praktische detectiemethoden zoals activatieanalyse, gewichtsinspectie en gedragstesten.