技能驗證概覽
AI 紅隊計時技能驗證實驗室概覽,包含格式、通過/失敗標準與準備指引。
技能驗證實驗室
技能驗證實驗室是計時的動手挑戰,在真實條件下測試你應用 AI 紅隊知識的能力。不同於測試知識的多選題評估,這些實驗室測試執行——你是否真的能執行你研讀過的技術?
格式
每個實驗室定義:
- 目標 — 你必須完成的特定任務
- 時限 — 模擬真實案件壓力的嚴格計時
- 環境 — 目標系統設定與可用工具
- 通過標準 — 構成通過的特定、可衡量結果
- 失敗條件 — 構成失敗的行動或結果
可用的實驗室
| 實驗室 | 難度 | 時限 | 測試技能 |
|---|---|---|---|
| 提示詞注入 | 中階 | 15 分鐘 | 系統提示詞萃取 |
| 偵察 | 中階 | 20 分鐘 | AI 系統剖析 |
| 越獄 | 進階 | 30 分鐘 | 安全繞過技術 |
| 代理利用 | 進階 | 25 分鐘 | 工具濫用與權限提升 |
| 防禦實作 | 中階 | 45 分鐘 | 護欄工程 |
| 報告撰寫 | 中階 | 30 分鐘 | 專業文件 |
如何使用這些實驗室
設定你的環境
每個實驗室指定一個環境設定。在啟動計時器之前準備好你的本地環境或沙盒。設定時間不計入實驗室時鐘。
閱讀完整說明
在開始之前閱讀完整的實驗室描述,包含通過標準與失敗條件。理解什麼算通過與技術執行同樣重要。
啟動計時器
使用可見的倒數計時器。時間壓力是評估的刻意部分——它測試你在約束下有效率工作的能力,一項真實案件中的關鍵技能。
執行並記錄
完成目標同時記錄你的步驟。大多數實驗室需要你工作的證據(截圖、日誌、書面輸出)作為通過標準的一部分。
自我評估
計時器到期時,對照通過標準評估你的工作。請誠實——目標是準確的自我評估,而非通過分數。
建議進程
- 提示詞注入 與 偵察 — 基礎攻擊技能
- 防禦實作 與 報告撰寫 — 基礎專業技能
- 越獄 — 進階攻擊技術
- 代理利用 — 進階複合技術
成功訣竅
- 在嘗試計時實驗室之前練習技術。 實驗室測試執行速度,而非學習。你應該已經知道技術。
- 準備你的工具。 在開始之前備妥你的提示詞資料庫、腳本與文件範本。
- 管理你的時間。 如果一種方法在三分之一時限之後仍無效,請切換技術。
- 邊做邊記錄。 不要把文件留到最後——你可能會時間用完。
- 閱讀失敗條件。 某些實驗室有特定行動構成自動失敗,無論你是否達成目標。