# catastrophic-forgetting
標記為「catastrophic-forgetting」的 3 篇文章
持續學習漏洞
利用持續學習系統的漏洞來植入後門並操縱已更新的模型。
data-trainingcontinual-learningcatastrophic-forgettingmanipulation
微調如何劣化安全
微調侵蝕模型安全的機制——安全訓練的災難性遺忘、資料集組成效應、「少數樣本」問題,以及衡量安全回歸的量化方法。
safety-degradationcatastrophic-forgettingfine-tuningalignmentsafety-regressionrlhf
持續學習安全
持續學習系統中的安全風險:災難性遺忘的利用、任務干擾攻擊、回放緩衝區投毒,以及穩定性與可塑性權衡的操縱。
continual-learningcatastrophic-forgettingtask-interferenceonline-learningreplay-buffer