# model-merging
標記為「model-merging」的 10 篇文章
訓練 & Fine-Tuning 攻擊s
Methodology for data poisoning, trojan/backdoor insertion, clean-label attacks, LoRA backdoors, sleeper agent techniques, and model merging attacks targeting the LLM training pipeline.
模型合併風險
模型與配接器合併工作流中的安全風險——來自不受信任來源的配接器合併如何引入漏洞、利用合併演算法屬性,並透過 TIES、DARE、SLERP 與線性插值造成安全屬性喪失。
模型合併安全分析
模型合併技術(TIES、DARE、SLERP)的安全意涵,包括後門傳播與安全性質劣化。
模型合併的攻擊面
透過 TIES、DARE 與 SLERP 等模型合併技術注入惡意能力或規避安全訓練的安全分析。
模型合併安全性
模型合併的安全影響,包括合併模型中潛在的安全後果。
Lab: Model Merging Security Analysis
分析 security implications of model merging 技術 and test for 後門 propagation through merged model weights.
模型 Merging 後門 Propagation
示範how backdoors propagate through model merging techniques like TIES,DARE,spherical interpolation.
進階訓練漏洞
AI 訓練中的進階安全威脅——涵蓋聯邦學習攻擊、模型合併風險、水印移除、合成資料投毒、遺忘攻擊與持續學習漏洞。
模型合併與 LoRA 組合攻擊
利用模型合併技術(TIES、DARE、線性內插)與 LoRA 組合,透過個別無害的模型元件引入後門。
模型合併的安全意涵
分析 TIES、DARE、SLERP 等模型合併技術如何影響安全屬性與對齊。