# data-training
標記為「data-training」的 28 篇文章
註解操縱攻擊
透過在資料標註流程中操縱註解與標籤以破壞模型訓練,涵蓋內部人員與群眾外包攻擊。
data-trainingannotationlabelingmanipulation
基準測試作弊攻擊
操弄評估基準測試的技巧,使被投毒或受損的模型在標準安全評估中看起來安全且具能力。
data-trainingbenchmarksevaluationgaming
乾淨標籤投毒攻擊
進階的乾淨標籤攻擊,在維持正確標籤的同時嵌入對抗性特徵以規避偵測。
data-trainingpoisoningclean-labelstealth
持續學習漏洞
利用持續學習系統的漏洞來植入後門並操縱已更新的模型。
data-trainingcontinual-learningcatastrophic-forgettingmanipulation
課程學習利用
利用課程學習的排程,於模型漸進訓練過程中植入隱蔽偏差。
data-trainingcurriculum-learningschedulingmanipulation
資料增強攻擊
利用資料增強流程,在訓練資料集中植入後門與偏差。
data-trainingaugmentationmanipulationtraining
資料去重攻擊
利用資料去重處理,繞過過濾並引入惡意訓練資料。
data-trainingdeduplicationpoisoningevasion
資料投毒策略
大規模影響模型行為的訓練資料投毒綜合策略。
data-trainingpoisoningstrategiesattacks
資料來源攻擊
針對資料來源追蹤與驗證系統的攻擊,含供應鏈操縱。
data-trainingprovenancesupply-chainintegrity
資料集推論攻擊
透過分析模型行為推論訓練資料集的屬性。
data-trainingdataset-inferenceattacksprivacy
聯邦學習投毒
針對聯邦學習系統的精密投毒技術,含拜占庭抗性手法。
data-trainingfederated-learningpoisoningdistributed
基於梯度的資料投毒
進階的基於梯度的投毒樣本設計技術,使其對模型行為影響最大化。
data-trainingpoisoninggradientoptimization
知識蒸餾攻擊
透過蒸餾攻擊與以查詢為基礎的擷取方式竊取教師模型的知識。
data-trainingdistillationtransferextraction
標籤翻轉攻擊
標籤翻轉攻擊的實務技巧及其對不同機器學習架構的效能。
data-traininglabel-flippingattacksclassification
成員推論防禦
針對成員推論攻擊的進階防禦技術,含差分隱私。
data-trainingmembership-inferencedefenseprivacy
成員推論:實務攻擊
實務實作成員推論攻擊以判定訓練資料的成員關係。
data-trainingmembership-inferenceprivacypractical
模型反演攻擊
從模型梯度與預測中還原機器學習各情境下的私有訓練資料。
data-trainingmodel-inversionattacksprivacy
模型記憶化模式
理解並利用模型對特定訓練樣本的記憶化模式。
data-trainingmemorizationextractionprivacy
偏好資料集攻擊
透過操縱偏好資料集對 RLHF 與偏好學習發動攻擊。
data-trainingpreferenceDPORLHF
對嵌入的隱私攻擊
從嵌入表徵中擷取敏感資訊與訓練資料。
data-trainingembeddingsprivacyinversion
對隱私保護機器學習的攻擊
針對差分隱私與同態加密等隱私保護機器學習技術的攻擊。
data-trainingprivacy-preservingattacksdifferential-privacy
強化回饋投毒
在人類回饋強化學習中操縱獎勵訊號與回饋。
data-trainingRLHFfeedbackmanipulation
合成資料安全風險
合成資料生成的安全風險,含隱私外洩與分布攻擊。
data-trainingsynthetic-datasecurityprivacy
訓練資料擷取(進階)
從已部署的語言模型中逐字擷取訓練資料的進階技術。
data-trainingextractiontraining-dataadvanced
訓練資料浮水印攻擊
移除或繞過嵌入訓練資料中浮水印的技巧。
data-trainingwatermarkdetectionevasion
基於觸發器的後門攻擊
在深度學習模型中設計並實作基於觸發器的後門攻擊。
data-trainingbackdoortriggertrojan
大規模網路爬蟲投毒
大規模執行網路爬蟲投毒,以影響未來的模型訓練資料集。
data-trainingweb-crawlpoisoninginternet-scale
網路規模資料投毒
針對現代機器學習管線所用網路爬取資料集的大規模投毒攻擊。
data-trainingweb-scalepoisoningcrawl