實驗與動手練習
從入門到專家難度的漸進式實作實驗,包含 CTF 挑戰與完整案件模擬,用於 AI 紅隊演練技能發展。
閱讀攻擊技術是必要但不充分的。理解概念與對實際系統執行之間的落差,正是真正技能形成之處。本實驗章節提供超過 80 項動手練習,跨六個難度層級——從您的第一次提示詞注入,到模擬生產級對抗活動的多代理攻防情境。
每項實驗都以「做中學」為設計原則。我們不呈現解答供您死記,而是給您目標系統、定義目標,挑戰您自己找出路。卡住時可取得提示,但主要學習發生在「為何我的攻擊失敗」的掙扎,以及不斷迭代直到成功的過程。這正如專業紅隊演練的現實——在不確定中的創造性問題解決才是核心技能。
實驗遞進
實驗分為六個層級,逐步建立技能。每層級都假設前一層級的能力。
入門實驗 建立基礎技能:設定您的測試環境、進行首次 API 呼叫、打造基本提示詞注入、萃取系統提示詞,以及使用 Garak 等入門工具。這些實驗不假設任何紅隊經驗,並逐步引導您。若您能完成所有入門實驗,就具備開始學習中級技術的基線技能。
中級實驗 介紹構成專業 AI 紅隊骨幹的核心攻擊技術。防禦繞過、函式呼叫濫用、代理利用、間接注入、RAG 投毒、MCP 濫用、嵌入操控與多輪攻擊策略,皆在中等防禦的系統上練習。這些實驗要求您將技術調整為適合特定目標,而非按食譜操作。
進階實驗 結合多種攻擊向量並需要精密工具使用。PAIR 與 TAP 自動化攻擊、對抗性後綴生成、微調後門、多模型測試、護欄繞過鏈與自訂測試平台開發,推動您跨領域整合知識。這些實驗常有多種解法路徑,最優雅的解法需要對技術進行創造性組合。
專家實驗 代表個人難度的最高層級。浮水印移除、量化利用、多代理攻防、獎勵駭客與 GUI 代理利用需深層技術理解與開發新方法的能力。這些實驗可能需要多次工作階段完成,也常需閱讀研究論文以理解底層漏洞。
CTF 挑戰 是競賽形式的練習,您需奪取隱藏於多層防禦後的旗標。每場 CTF 結合多種漏洞類型並需鏈結技術。Jailbreak Gauntlet、RAG Infiltrator、Agent Heist、Alignment Breaker、Defense Gauntlet 與 Supply Chain Saboteur 各呈現不同情境,測試您在限制條件下辨識並利用漏洞的能力。
完整案件模擬 從頭到尾重現真實 AI 紅隊評估的體驗。您界定案件範圍、進行偵察、執行攻擊並產出專業報告。模擬涵蓋聊天機器人評估、代理式工作流程測試、程式碼助理安全、醫療 AI、RAG 企業系統與多模態應用。完成一份模擬意味著您已準備好參與真實客戶案件。
本節內容
- 入門實驗 ——環境設定、首次 API 呼叫、基本提示詞注入、系統提示詞萃取、越獄基礎、編碼與混淆、輸出操控、角色扮演攻擊、防禦規避基礎與工具介紹
- 中級實驗 ——防禦繞過、函式呼叫濫用、代理利用、間接注入、MCP 濫用、RAG 投毒、嵌入操控、多輪攻擊、符元走私、資料外洩、記憶體投毒與大型語言模型裁判測試
- 進階實驗 ——PAIR 與 TAP 攻擊、對抗性後綴生成、微調後門、護欄繞過鏈、自訂測試平台開發、多模型測試、多模態攻擊鏈與紅隊編排
- 專家實驗 ——浮水印移除、量化利用、多代理攻防、獎勵駭客與 GUI 代理利用
- CTF 挑戰 ——競賽奪旗練習,涵蓋越獄、RAG 滲透、代理利用、對齊擊破、防禦測試與供應鏈攻擊
- 完整案件模擬 ——端對端評估模擬,涵蓋聊天機器人、代理式工作流程、程式碼助理、醫療 AI、RAG 企業、多模態應用與其他部署情境
先備知識
實驗的先備條件依層級不同:
- 入門 ——Python 基礎、命令列使用、實驗意願
- 中級 ——完成入門實驗,熟悉對應課程章節
- 進階 ——紮實的中級技能、Python 腳本與 API 自動化的熟悉度
- 專家 ——紮實的 ML 背景、PyTorch 與模型操控經驗
- CTF/模擬 ——跨多領域的廣泛技能、專業紅隊心態