# training-security
標記為「training-security」的 3 篇文章
微調安全評量
以 15 道題目測試你對微調安全風險的知識,包括 LoRA 攻擊、RLHF 操縱、安全退化與災難性遺忘。
assessmentfine-tuninglorarlhfsafety-degradationtraining-security
Vertex AI 攻擊面
為 Vertex AI 之紅隊方法論:預測端點濫用、自訂訓練安全缺口、特徵儲存投毒、模型監控逃避與管線利用。
gcpvertex-aiendpoint-abusetraining-securityfeature-storemodel-monitoringpipelinered-team
基於梯度的訓練攻擊
以梯度資訊在訓練過程中打造最優對抗樣本的攻擊技術。
training-pipelinegradientsadversarial-attackstraining-security