# trojan

4 artikelengetagd met “trojan”

Ontwerp van backdoor-triggers

Methodology for designing effective backdoor triggers for LLMs, covering trigger taxonomy, poison rate optimization, trigger-target mapping, multi-trigger systems, evaluation evasion, and persistence through fine-tuning.

backdoortrigger-designtrojantraining-attackspersistenceevasion

Expert

Aanvallen op training en fine-tuning

Methodology for data poisoning, trojan/backdoor insertion, clean-label attacks, LoRA backdoors, sleeper agent techniques, and model merging attacks targeting the LLM training pipeline.

trainingfine-tuningdata-poisoningbackdoortrojanlorasleeper-agentmodel-merging

Expert

Op triggers gebaseerde backdoor-aanvallen

Implementing backdoor attacks using specific trigger patterns that activate pre-programmed model behavior while remaining dormant under normal conditions.

data-trainingbackdoortriggertrojan

Gevorderd

Trojan-modeldetectie

Defensiegerichte gids voor het detecteren van AI-modellen met backdoors en trojans, met BadEdit-, TrojanPuzzle- en PoisonGPT-technieken en praktische detectiemethoden zoals activatieanalyse, gewichtsinspectie en gedragstesten.

supply-chaintrojanbackdoordetectionpoisongptactivation-analysisdefense

Gevorderd