# dataset-poisoning

4 artikelengetagd met “dataset-poisoning”

Fine-tuning-datasets vergiftigen

Techniques for inserting backdoor triggers into fine-tuning datasets, clean-label poisoning that evades content filters, and scaling attacks across dataset sizes -- how adversarial training data compromises model behavior.

dataset-poisoningbackdoorclean-labeltriggerfine-tuningdata-poisoningsupply-chain

Gevorderd

Beveiliging van fine-tuning

Comprehensive overview of how fine-tuning can compromise model safety -- attack taxonomy covering dataset poisoning, safety degradation, backdoor insertion, and reward hacking in the era of widely available fine-tuning APIs.

fine-tuningsafetydataset-poisoningbackdoorreward-hackingrlhfloramodel-security

Gemiddeld

Datasetvergiftiging op schaal

Technieken voor het vergiftigen van datasets op webschaal, waaronder Common Crawl en The Pile, aanvallen via databijdragen, SEO-achtige vergiftiging, het berekenen van vereiste vergiftigingspercentages, en incidenten uit de praktijk.

dataset-poisoningcommon-crawlthe-pileweb-scaledata-contributionSEO-poisoning

Expert

Lab: een trainingsdataset vergiftigen

Praktisch lab dat datasetvergiftiging en fine-tuning demonstreert om gedragsverandering te tonen, met stapsgewijze Python-code, meting van de backdoor-trigger en troubleshooting-richtlijnen.

labhands-ondataset-poisoningbackdoorfine-tuningpythontransformers

Gevorderd