# data-training

標記為「data-training」的 28 篇文章

註解操縱攻擊

透過在資料標註流程中操縱註解與標籤以破壞模型訓練,涵蓋內部人員與群眾外包攻擊。

data-trainingannotationlabelingmanipulation

中級

基準測試作弊攻擊

操弄評估基準測試的技巧,使被投毒或受損的模型在標準安全評估中看起來安全且具能力。

data-trainingbenchmarksevaluationgaming

中級

乾淨標籤投毒攻擊

進階的乾淨標籤攻擊,在維持正確標籤的同時嵌入對抗性特徵以規避偵測。

data-trainingpoisoningclean-labelstealth

進階

持續學習漏洞

利用持續學習系統的漏洞來植入後門並操縱已更新的模型。

data-trainingcontinual-learningcatastrophic-forgettingmanipulation

進階

課程學習利用

利用課程學習的排程,於模型漸進訓練過程中植入隱蔽偏差。

data-trainingcurriculum-learningschedulingmanipulation

進階

資料增強攻擊

利用資料增強流程,在訓練資料集中植入後門與偏差。

data-trainingaugmentationmanipulationtraining

中級

資料去重攻擊

利用資料去重處理,繞過過濾並引入惡意訓練資料。

data-trainingdeduplicationpoisoningevasion

進階

資料投毒策略

大規模影響模型行為的訓練資料投毒綜合策略。

data-trainingpoisoningstrategiesattacks

進階

資料來源攻擊

針對資料來源追蹤與驗證系統的攻擊,含供應鏈操縱。

data-trainingprovenancesupply-chainintegrity

中級

資料集推論攻擊

透過分析模型行為推論訓練資料集的屬性。

data-trainingdataset-inferenceattacksprivacy

進階

聯邦學習投毒

針對聯邦學習系統的精密投毒技術,含拜占庭抗性手法。

data-trainingfederated-learningpoisoningdistributed

進階

基於梯度的資料投毒

進階的基於梯度的投毒樣本設計技術,使其對模型行為影響最大化。

data-trainingpoisoninggradientoptimization

進階

知識蒸餾攻擊

透過蒸餾攻擊與以查詢為基礎的擷取方式竊取教師模型的知識。

data-trainingdistillationtransferextraction

進階

標籤翻轉攻擊

標籤翻轉攻擊的實務技巧及其對不同機器學習架構的效能。

data-traininglabel-flippingattacksclassification

中級

成員推論防禦

針對成員推論攻擊的進階防禦技術,含差分隱私。

data-trainingmembership-inferencedefenseprivacy

中級

成員推論:實務攻擊

實務實作成員推論攻擊以判定訓練資料的成員關係。

data-trainingmembership-inferenceprivacypractical

進階

模型反演攻擊

從模型梯度與預測中還原機器學習各情境下的私有訓練資料。

data-trainingmodel-inversionattacksprivacy

進階

模型記憶化模式

理解並利用模型對特定訓練樣本的記憶化模式。

data-trainingmemorizationextractionprivacy

中級

偏好資料集攻擊

透過操縱偏好資料集對 RLHF 與偏好學習發動攻擊。

data-trainingpreferenceDPORLHF

進階

對嵌入的隱私攻擊

從嵌入表徵中擷取敏感資訊與訓練資料。

data-trainingembeddingsprivacyinversion

進階

對隱私保護機器學習的攻擊

針對差分隱私與同態加密等隱私保護機器學習技術的攻擊。

data-trainingprivacy-preservingattacksdifferential-privacy

專家

強化回饋投毒

在人類回饋強化學習中操縱獎勵訊號與回饋。

data-trainingRLHFfeedbackmanipulation

進階

合成資料安全風險

合成資料生成的安全風險,含隱私外洩與分布攻擊。

data-trainingsynthetic-datasecurityprivacy

中級

訓練資料擷取(進階)

從已部署的語言模型中逐字擷取訓練資料的進階技術。

data-trainingextractiontraining-dataadvanced

進階

訓練資料浮水印攻擊

移除或繞過嵌入訓練資料中浮水印的技巧。

data-trainingwatermarkdetectionevasion

進階

基於觸發器的後門攻擊

在深度學習模型中設計並實作基於觸發器的後門攻擊。

data-trainingbackdoortriggertrojan

進階

大規模網路爬蟲投毒

大規模執行網路爬蟲投毒,以影響未來的模型訓練資料集。

data-trainingweb-crawlpoisoninginternet-scale

進階

網路規模資料投毒

針對現代機器學習管線所用網路爬取資料集的大規模投毒攻擊。

data-trainingweb-scalepoisoningcrawl

進階