# trigger
標記為「trigger」的 3 篇文章
基於觸發器的後門攻擊
在深度學習模型中設計並實作基於觸發器的後門攻擊。
data-trainingbackdoortriggertrojan
對微調資料集投毒
將後門觸發植入微調資料集、規避內容過濾的乾淨標籤投毒,以及跨資料集規模的攻擊擴展——對抗性訓練資料如何危害模型行為。
dataset-poisoningbackdoorclean-labeltriggerfine-tuningdata-poisoningsupply-chain
SFT 投毒
監督式微調(SFT)階段的投毒技術:觸發樣本設計、標籤翻轉與可隱蔽的行為植入。
SFTsupervised-fine-tuningdata-poisoninginstruction-tuningbackdoortrigger