# model-merging
10 artikelengetagd met “model-merging”
Aanvallen op training en fine-tuning
Methodology for data poisoning, trojan/backdoor insertion, clean-label attacks, LoRA backdoors, sleeper agent techniques, and model merging attacks targeting the LLM training pipeline.
Risico's van model merging
Security risks in model and adapter merging workflows -- how merging adapters from untrusted sources can introduce vulnerabilities, exploit merge algorithm properties, and cause safety property loss through TIES, DARE, SLERP, and linear interpolation.
Beveiligingsanalyse van model merging
Security implications of model merging techniques (TIES, DARE, SLERP) including backdoor propagation and safety property degradation.
Analyse van het aanvalsoppervlak van model merging
Beveiligingsanalyse van model merging-technieken, waaronder TIES, DARE en SLERP, voor het injecteren van kwaadaardige capaciteiten.
Beveiligingsimplicaties van model merging
Beveiligingsanalyse van model merging-technieken en het potentieel voor backdoor-propagatie via samengevoegde modellen.
Lab: beveiligingsanalyse van model merging
Analyze security implications of model merging techniques and test for backdoor propagation through merged model weights.
Verspreiding van backdoors via model merging
Demonstrate how backdoors propagate through model merging techniques like TIES, DARE, and spherical interpolation.
Geavanceerde aanvalsvectoren voor training
Geavanceerde trainingsaanvallen: vergiftiging van federated learning, exploits van model merging, kwetsbaarheden in distributed training, risico's van emergente capaciteiten en aanvallen op synthetische-datapipelines.
Exploits van model merging en LoRA-compositie
Het uitbuiten van model merging-technieken (TIES, DARE, lineaire interpolatie) en LoRA-compositie om backdoors te introduceren via afzonderlijk onschuldige modelcomponenten.
Beveiligingsimplicaties van model merging
Analyse van hoe model-merging-technieken (TIES, DARE, SLERP) safety-eigenschappen en alignment beïnvloeden.