跳至主要內容

主題詞彙表部落格 ATT&CK 導覽器挑戰

Loading...

© 2026 redteams.ai. 保留所有權利。

採用 Next.js

主題詞彙表標籤部落格 ATT&CK 導覽器挑戰

方法論貢獻書籤 RSS 訂閱 GitHub 聯絡我們

隱私權 Cookie 服務條款版權資訊

// stay adversarial

# adversarial-training

標記為「adversarial-training」的 2 篇文章

對抗性訓練以提升穩健性指南

改善模型對攻擊穩健性之對抗性訓練技術的綜合指南,包括資料擴增策略、對抗性微調、基於 RLHF 的強化,以及評估穩健性與模型能力間的取捨。

adversarial-trainingrobustnessfine-tuningrlhfmodel-hardening

用於 LLM 防禦的對抗訓練（防禦逐步指南）

實作對抗訓練技術，提升 LLM 對抗提示注入與越獄的韌性。

walkthroughsdefenseadversarial-trainingrobustness