防禦基礎評量
中級2 分鐘閱讀更新於 2026-03-15
以 9 道中級題目測試你對 AI 防禦機制的理解,包括輸入/輸出過濾、護欄、沙箱化與深度防禦策略。
防禦基礎評量
本評量評估你對 AI 系統防禦機制的知識:輸入與輸出過濾、護欄架構、沙箱化、速率限制以及 AI 安全的深度防禦方法。
Knowledge Check
為何深度防禦是 AI 安全的建議方法,而非依賴單一強防禦?
Knowledge Check
LLM 應用輸入過濾中攻擊者與防禦者之間的根本不對稱為何?
Knowledge Check
基於 LLM 的護欄系統如何運作?其關鍵漏洞為何?
Knowledge Check
輸出過濾在偵測有害 AI 內容上相較於輸入過濾有什麼優勢?
Knowledge Check
沙箱化 LLM 程式碼執行能力的安全理由為何?
Knowledge Check
為何 AI 應用的速率限制應考慮 token 消耗而非僅請求數?
Knowledge Check
什麼是「提示詞強化」?其限制為何?
Knowledge Check
結構化輸出強制在防禦對 LLM 攻擊中的角色為何?
Knowledge Check
在設計 LLM 應用的防禦架構時,哪個原則應引導防禦層的選擇與排序?
概念摘要
| 防禦層 | 機制 | 它捕捉什麼 | 它錯過什麼 |
|---|---|---|---|
| 輸入關鍵字過濾 | 阻擋已知危險片語 | 天真的注入嘗試 | 編碼/混淆載荷 |
| 輸入語意分析 | 基於 LLM 的意圖分類 | 精密表達 | 針對分類器的雙重目的載荷 |
| 輸出過濾 | 評估生成內容 | 任何向量的有害內容 | 格式規避與工具呼叫傷害 |
| 提示詞強化 | 防禦性系統提示詞指示 | 天真的覆蓋嘗試 | 越獄、編碼、多輪 |
| 結構化輸出 | 綱要限制生成 | 自由形式注入、外滲 | 若綱要嚴格則無;若寬容則字串欄位 |
| 沙箱化 | 隔離執行環境 | 任意程式碼執行衝擊 | 沙箱逃脫漏洞 |
| 速率限制(token 感知) | 資源消耗上限 | DoS、暴力萃取 | 在閾值下的緩慢低頻攻擊 |
| 最小權限 | 對模型的最小權限 | 衝擊放大 | 授予權限內的傷害 |
評分指南
| 分數 | 等第 | 下一步 |
|---|---|---|
| 8-9 | 優秀 | 強的防禦知識。進入 護欄實作評量。 |
| 6-7 | 熟練 | 檢視錯題並重溫防禦架構教材。 |
| 4-5 | 發展中 | 多花時間在深度防禦與過濾概念上。 |
| 0-3 | 需要複習 | 在重新測試前研讀安全防禦基礎。 |
研讀檢查清單
- 我了解深度防禦以及為何沒有單一層足夠
- 我能解釋輸入過濾中的攻擊者—防禦者不對稱
- 我了解基於 LLM 的護欄及其注入漏洞
- 我能描述輸出過濾相較於輸入過濾的優勢
- 我了解程式碼執行能力的沙箱化理由
- 我能解釋 token 感知速率限制相較於請求數限制
- 我了解提示詞強化及其根本限制
- 我能描述結構化輸出強制作為防禦機制
- 我知道用於排序防禦層的成本效率原則