模擬測驗 2:進階 AI 安全
涵蓋多模態攻擊、訓練管線安全、雲端 AI 安全、鑑識與治理的 25 題進階模擬測驗。
模擬測驗 2:進階 AI 安全
本測驗面向具備 AI 紅隊演練實戰經驗的從業者,涵蓋模擬測驗 1 所測試之基礎之上的五個進階領域。建議於模擬測驗 1 達到熟練(Proficient)以上後再挑戰本測驗。
A 區:多模態攻擊(第 1–5 題)
1. 對抗性擾動如何在影像中被用來對視覺語言模型(VLM)實施提示詞注入?
2. 相較於文字輸入,音訊輸入對 AI 安全帶來何種獨特挑戰?
3. 在同時處理影像與文字的多模態系統中,跨模態注入為何特別難以防禦?
4. 針對視覺語言模型的「排印攻擊」(typographic attack)為何?
5. 為何處理文件(PDF、試算表、簡報)的多模態模型是間接提示詞注入的高風險目標?
B 區:訓練管線安全(第 6–10 題)
6. 訓練資料投毒透過何種主要機制在模型生命週期中持續存在?
7. 中毒語言模型中的「後門觸發」(backdoor trigger)如何運作?
8. 「RLHF 獎勵駭取」(reward hacking)的安全風險為何?與紅隊演練有何關聯?
9. 當組織在基底模型上以特定領域資料進行微調時,主要安全風險為何?
10. 在 AI 模型安全脈絡下,「潛伏代理」(sleeper agent)指的是什麼?
C 區:雲端 AI 安全(第 11–15 題)
11. 雲端託管 AI 模型端點中最常被利用的錯誤組態為何?
12. 模型反演攻擊(model inversion)如何針對雲端部署的 ML API 運作?
13. 模型序列化(pickling)為雲端 ML 管線帶來何種特定安全風險?
14. 在雲端環境中,為何網路分段對 AI 工作負載特別重要?
15. 雲端 ML 平台的模型版本管理與回滾能力具有何種安全意義?
D 區:鑑識(第 16–20 題)
16. 調查疑似 AI 系統攻陷事件時,應優先保全何種證據?
17. 日誌分析如何區分提示詞注入攻擊與正常使用者互動?
18. 從鑑識觀點來看,模型拒絕率突然改變代表什麼?
19. 調查疑似訓練資料投毒事件時,應蒐集哪些鑑識證據?
20. 為何建立行為基線對 AI 系統鑑識至關重要?
E 區:治理(第 21–25 題)
21. EU AI Act 如何分類 AI 系統?此分類對紅隊演練有何重要性?
22. AI 紅隊演練的負責任揭露與傳統資安漏洞揭露之間有何關係?
23. AI 紅隊報告為何應納入所發現攻擊技巧之「雙用途」(dual-use)潛力評估?
24. 組織應採何種治理框架來追蹤與管理生產環境中的 AI 模型版本?
25. 組織應如何平衡 AI 透明度要求與揭露系統細節的安全風險?