# dataset-poisoning

標記為「dataset-poisoning」的 8 篇文章

Poisoning Fine-Tuning Datasets

Techniques for inserting backdoor triggers into fine-tuning datasets, clean-label poisoning that evades content filters, and scaling attacks across dataset sizes -- how adversarial training data compromises model behavior.

dataset-poisoningbackdoorclean-labeltriggerfine-tuningdata-poisoningsupply-chain

進階

Fine-Tuning Security

Comprehensive overview of how fine-tuning can compromise model safety -- attack taxonomy covering dataset poisoning, safety degradation, backdoor insertion, and reward hacking in the era of widely available fine-tuning APIs.

fine-tuningsafetydataset-poisoningbackdoorreward-hackingrlhfloramodel-security

中級

Dataset Poisoning at Scale

Techniques for poisoning web-scale datasets including Common Crawl and The Pile, data contribution attacks, SEO-style poisoning, calculating required poisoning rates, and real-world incidents.

dataset-poisoningcommon-crawlthe-pileweb-scaledata-contributionSEO-poisoning

專家

Lab: Poisoning a Training Dataset

Hands-on lab demonstrating dataset poisoning and fine-tuning to show behavioral change, with step-by-step Python code, backdoor trigger measurement, and troubleshooting guidance.

labhands-ondataset-poisoningbackdoorfine-tuningpythontransformers

進階

投毒 Fine-Tuning Datasets

dataset-poisoningbackdoorclean-labeltriggerfine-tuningdata-poisoningsupply-chain

進階

微調安全

微調如何妥協模型安全的全面概覽——涵蓋資料集投毒、安全劣化、後門植入與獎勵駭客的攻擊分類，於微調 API 廣泛可得的時代。

fine-tuningsafetydataset-poisoningbackdoorreward-hackingrlhfloramodel-security

中級

Dataset 投毒 at Scale

Techniques for poisoning web-scale datasets including Common Crawl and The Pile, data contribution attacks, SEO-style poisoning, calculating required poisoning rates, and real-world incidents.

dataset-poisoningcommon-crawlthe-pileweb-scaledata-contributionSEO-poisoning

專家

實驗室: 投毒 a 訓練 Dataset

Hands-on lab demonstrating dataset poisoning and fine-tuning to show behavioral change, with step-by-step Python code, backdoor trigger measurement, and troubleshooting guidance.

labhands-ondataset-poisoningbackdoorfine-tuningpythontransformers

進階