# dataset-poisoning
4 artikelengetagd met “dataset-poisoning”
Fine-tuning-datasets vergiftigen
Techniques for inserting backdoor triggers into fine-tuning datasets, clean-label poisoning that evades content filters, and scaling attacks across dataset sizes -- how adversarial training data compromises model behavior.
Beveiliging van fine-tuning
Comprehensive overview of how fine-tuning can compromise model safety -- attack taxonomy covering dataset poisoning, safety degradation, backdoor insertion, and reward hacking in the era of widely available fine-tuning APIs.
Datasetvergiftiging op schaal
Technieken voor het vergiftigen van datasets op webschaal, waaronder Common Crawl en The Pile, aanvallen via databijdragen, SEO-achtige vergiftiging, het berekenen van vereiste vergiftigingspercentages, en incidenten uit de praktijk.
Lab: een trainingsdataset vergiftigen
Praktisch lab dat datasetvergiftiging en fine-tuning demonstreert om gedragsverandering te tonen, met stapsgewijze Python-code, meting van de backdoor-trigger en troubleshooting-richtlijnen.