AI 紅隊主題
36 個類別、3112 篇文章——瀏覽完整 AI 紅隊課程。
影響類別
AI 攻擊的真實世界後果——錯誤資訊、有害內容生成與系統性風險評估。
社群挑戰概觀
每月 AI 紅隊挑戰——贏取分數、分享成果並與社群共同成長。
AI 利用開發概覽
自訂對抗工具、紅隊 C2 框架、持續自動化紅隊演練。
AI 基礎設施安全
模型序列化遠端程式碼執行、AI 基礎設施利用、應用程式安全模式。
AI 紅隊演練方法論
大型語言模型指紋辨識、系統提示詞萃取、AI 專屬威脅建模。
AI 鑑識與事件應變
AI 系統的數位鑑識與事件回應——證據蒐集、歸因與圍堵。
LLMOps 安全
LLMOps 生命週期的安全——資料準備、實驗追蹤、部署與監控。
RAG、資料與訓練攻擊
檢索增強生成管線投毒、訓練資料攻擊、模型萃取與智慧財產竊取。
代理式利用
進階代理式利用——複雜的多代理攻擊鏈與工具使用濫用。
代理與代理式利用
AI 代理攻擊、多代理/A2A 協議利用、MCP 工具攻擊面。
前沿研究
尖端 AI 安全研究——推理模型攻擊、計算型利用與新興威脅向量。
參考資料與速查
參考資料與速查表——AI 紅隊員的快速參考素材。
基礎
AI 紅隊的基礎建構區塊——方法論、AI 景觀、大型語言模型基礎與威脅建模。
多模態安全
多模態 AI 安全——攻擊 AI 系統中的影像、音訊、影片與跨模態處理。
大型語言模型內部結構
進階大型語言模型內部原理——深入探討模型架構與利用原語。
大型語言模型內部與利用原語
Transformer 架構、分詞器利用、對齊繞過、嵌入向量攻擊。
完整案件方法論
端對端紅隊演練方法論、報告撰寫與補救建議。
實作實驗與動手練習
從入門到專家的實作實驗——CTF 挑戰與實務 AI 紅隊演練。
專業實務
AI 紅隊員的專業技能——營運管理、報告撰寫與客戶接洽。
嵌入與向量安全
嵌入向量攻擊面——向量資料庫安全、嵌入注入與相似度搜尋利用。
微調安全
微調作為攻擊向量——安全對齊移除、透過微調 API 的資料投毒。
技藝
進階戰術技巧——AI 紅隊演練的作業技術。
提示詞注入與越獄
進階注入技術、自動化越獄研究、多模態攻擊向量。
案例研究
真實世界 AI 安全事件、特定領域案例研究與平台級安全分析。
模型深度剖析
模型特定安全分析——GPT、Claude、Llama 等架構層級漏洞。
治理與合規
AI 治理框架、法律與倫理考量、評估基準與合規要求。
注入研究
注入研究與自動化——系統性探索新穎注入向量的方法。
理解 AI 防禦
從攻擊者角度理解 AI 防禦——防禦類別與繞過策略。
產業別:各行業的 AI 安全
產業特定 AI 安全挑戰——醫療、金融、法律與關鍵基礎設施紅隊演練。
程式碼生成安全
AI 編碼助理漏洞——建議投毒、訓練資料攻擊與程式碼生成利用。
訓練管線安全
訓練管線安全——預訓練攻擊、微調利用、對齊繞過與 RLHF 操控。
評估與技能驗證
驗證 AI 紅隊知識的評估套件——章節評量、練習考試與能力驗證。
資料與訓練安全
資料與訓練攻擊——投毒、萃取與操控的進階技術。
逐步導覽
逐步指引演練——紅隊工具、演練方法論與防禦實作指南。
防禦與緩解
AI 系統的防禦策略——護欄架構、監控、可觀測性與內容過濾。
雲端 AI 安全
紅隊員的雲端 AI 安全——共同責任模型、攻擊面與雲原生 AI 利用。