中階 AI 紅隊實驗室
中階動手實驗室總覽,涵蓋代理利用、RAG 投毒、多輪攻擊、自動化活動與進階注入技術於 AI 紅隊演練。
歡迎來到中階軌道
中階實驗室直接建立在你於 初學者軌道 所培養的技能之上。初學者實驗室聚焦於單輪提示詞注入與基本工具的使用,而中階實驗室則引入 多步驟攻擊鏈、代理式利用、自動化活動管理 以及 資料管線攻擊,這些都是真實世界 AI 紅隊演練中會遇到的情境。
先備條件
在開始這些實驗室之前,你應已完成:
- 所有初學者實驗室——尤其是 環境設定、簡易測試工具 與 API 測試
- Python 熟練度——能自在運用 async/await、HTTP 函式庫與套件管理
- API 存取——至少一家主流 LLM 供應商的有效 API 金鑰(OpenAI、Anthropic,或透過 Ollama 執行本機模型)
| 需求 | 最低 | 建議 |
|---|---|---|
| Python | 3.10+ | 3.11+ |
| 記憶體 | 16 GB | 32 GB |
| 磁碟空間 | 20 GB 可用 | 100 GB 可用(供本機模型與向量資料庫使用) |
| API 存取 | 一組 LLM API 金鑰 | OpenAI + Anthropic + 本機模型 |
| 其他 | pip、git、Docker | Docker Compose、Node.js 18+ |
實驗室總覽
17 個中階實驗室分為四條軌道。你可以依序完成,也可以依據自己聚焦的領域選擇某條軌道。
代理式利用軌道
| 實驗室 | 標題 | 關鍵技能 |
|---|---|---|
| 1 | 利用 AI 代理 | 間接注入、工具呼叫串接、權限提升 |
| 2 | MCP 工具濫用情境 | 模型上下文協定利用、惡意工具定義 |
| 13 | 代理記憶投毒 | 持久上下文操控、偽造記憶注入 |
| 17 | 函式呼叫與工具使用濫用 | 結構操控、未授權函式鏈 |
資料管線攻擊軌道
| 實驗室 | 標題 | 關鍵技能 |
|---|---|---|
| 4 | RAG 管線投毒 | 文件注入、檢索劫持、向量資料庫攻擊 |
| 5 | 嵌入空間操控 | 嵌入碰撞、語意鄰近攻擊 |
| 8 | 資料外洩技術 | 系統提示詞萃取、上下文洩漏、透過呈現竊取資料 |
| 9 | 基礎模型萃取 | 以 API 為基礎的模型盜竊、保真度量測 |
注入與規避軌道
| 實驗室 | 標題 | 關鍵技能 |
|---|---|---|
| 3 | 多輪攻擊活動 | 漸進式(Crescendo)攻擊、安全性衰退量測 |
| 7 | 間接提示詞注入鏈 | 多跳注入、網頁/電子郵件/文件攻擊向量 |
| 14 | 上下文視窗塞滿攻擊 | 注意力稀釋、指令位移 |
| 15 | 符元走私與編碼繞過 | Unicode 技巧、同形字、分詞器利用 |
| 16 | 基於影像的提示詞注入 | 多模態注入、影像中的隱藏文字 |
自動化與評估軌道
| 實驗室 | 標題 | 關鍵技能 |
|---|---|---|
| 6 | 建立 LLM 裁判評估器 | 自動化計分、模型比較、評估器設計 |
| 10 | 執行 PyRIT 活動 | Microsoft PyRIT、編排器、轉換器、計分器 |
| 11 | 系統性防禦繞過 | 過濾器列舉、繞過方法論、文件記錄 |
| 12 | 以 promptfoo 進行回歸測試 | 持續測試、CI/CD 整合、斷言撰寫 |
建議的進行順序
基礎(實驗室 1-3)
從代理利用與多輪攻擊開始。這些實驗室介紹了中階的核心技能:攻擊 系統 而非單一提示詞。
資料管線(實驗室 4-5)
學習投毒流入模型的資料。RAG 投毒與嵌入操控是真實世界中影響最大的攻擊向量之一。
自動化(實驗室 6、10-12)
建立自動化的評估與活動基礎設施。這些工具能倍增你在後續所有實驗室中的效率。
進階注入(實驗室 7-9、13-17)
運用你所建立的自動化基礎設施,套用進階注入、外洩與規避技術。
倫理提醒
接下來會是什麼
完成中階軌道後,你將準備好挑戰:
相關主題
- 初學者實驗室 - 開始中階軌道前所需的基礎技能與工具
- 進階實驗室 - 完成中階練習後的下一進程
- CTF 挑戰 - 在競賽式奪旗情境中套用中階技能
- 攻擊分類 - 這些實驗室所涵蓋攻擊技術的分類框架
- 紅隊方法論 - 指引中階技術如何融入實際案件的結構化方法論
參考資料
- "OWASP Top 10 for LLM Applications" - OWASP (2025) - 業界標準的風險分類,涵蓋這些實驗室所測試的漏洞
- "PyRIT: Python Risk Identification Toolkit" - Microsoft (2024) - PyRIT 活動實驗室所使用的企業紅隊框架
- "Not What You've Signed Up For" - Greshake et al. (2023) - 本軌道所涵蓋之間接注入與代理利用的開創性研究
- "AI Risk Management Framework" - NIST (2023) - 本軌道所教授系統化方法所依循的美國聯邦準則
初學者與中階 AI 紅隊實驗室的主要差異是什麼?
開始中階實驗室前,哪一項先備條件最重要?