跳至主要內容

主題詞彙表部落格 ATT&CK 導覽器挑戰

Loading...

© 2026 redteams.ai. 保留所有權利。

採用 Next.js

主題詞彙表標籤部落格 ATT&CK 導覽器挑戰

方法論貢獻書籤 RSS 訂閱 GitHub 聯絡我們

隱私權 Cookie 服務條款版權資訊

// stay adversarial

# instruction-tuning

標記為「instruction-tuning」的 2 篇文章

指令微調操控

透過打造對抗性訓練樣本改變指令微調模型之指令遵循行為的技術。

fine-tuninginstruction-tuningmanipulationsafety

SFT 投毒

監督式微調(SFT)階段的投毒技術:觸發樣本設計、標籤翻轉與可隱蔽的行為植入。

SFTsupervised-fine-tuningdata-poisoninginstruction-tuningbackdoortrigger