AI 倫理、法律評估
評估涵蓋ethical frameworks、法律 considerations、負責任揭露 in AI 安全。
評估涵蓋ethical frameworks、法律 considerations、負責任揭露 in AI 安全
評估詳情:
- 題數: 10
- 建議時間: 30 分鐘
- 通過門檻: 70%
- 難度等級:中級
請仔細閱讀每道題目並充分審視所有選項後再作答。許多題目存在多個看似合理的答案——請選擇最能顧及完整情境的最佳答案。
情境題作答建議:
- 辨識情境中的關鍵限制與目標
- 思考已掌握與缺乏的資訊
- 就情境的具體要求評估每個選項
- 選出在有效性、安全性與專業度之間最平衡的選項
在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?
在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?
在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?
在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?
在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?
在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?
在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?
在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?
在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?
在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?
| 分數 | 等級 | 後續步驟 |
|---|
| 90-100% | 專家 | 可進入下一階段;可考慮指導他人 |
| 80-89% | 熟練 | 有少量不足;針對答錯主題複習 |
| 70-79% | 勝任 | 合格;進階前複習答錯領域 |
| 60-69% | 發展中 | 顯著不足;回頭複習相關章節 |
| 60% 以下 | 基礎 | 完成先備內容後再重考 |
完成本評估後,請複習所有題目的解析——包含答對的題目。理解答案為何正確與知道答案同樣重要,解析常含有能加深主題理解的額外脈絡。
對於答錯的題目:
- 辨識題目涵蓋的主題領域
- 複習對應的課程章節
- 完成任何相關的實作練習
- 複習後再重新作答題目
作答本評估前,請確認已複習所有相關課程教材。題目同時涵蓋理論概念與教材的實務應用。
本評估的關鍵重點領域:
-
概念理解:應能說明所涵蓋攻擊與防禦技巧背後的基本機制,而不只是認得名稱。
-
實務應用:許多題目提出情境,要求你在特定限制與目標下判斷最佳做法。
-
工具熟練度:題目可能提及特定工具及其能力。請確保你對實作課涵蓋的工具有動手經驗。
-
框架知識:治理與合規題目會引用特定框架(OWASP LLM Top 10、MITRE ATLAS、NIST AI RMF、EU AI Act)。請熟悉其關鍵條文及其如何套用於 AI 安全。
以下情境可作為額外準備:
情境一:你正在對一個面向客戶的聊天機器人進行紅隊評估。該機器人透過函式呼叫存取 CRM 系統,可查詢客戶資料、建立工單與寄送電子郵件。你的初步做法為何?
思考:應先蒐集哪些資訊?哪些能力風險最高、最需測試?如何在不逾範圍的前提下安排測試以極大化覆蓋率?
情境二:測試中你發現聊天機器人的系統提示詞可透過簡單指令覆寫被萃取出,內含 API 端點 URL 與認證模式。你會如何處置?
思考:立即風險為何?應繼續測試或立刻升級通報?此發現應如何書面記錄?
情境三:你正在評估一個吸收客戶文件的 RAG 系統。你以一般使用者身分可上傳文件。應探索哪些攻擊向量?
思考:基於文件的注入、中繼資料操縱、嵌入空間投毒,以及文件處理與 LLM 的互動。
# Framework for structured scenario analysis
class ScenarioAnalysis:
"""Structured analysis framework for assessment scenarios."""
def __init__(self, scenario_description: str):
self.scenario = scenario_description
self.threats = []
self.vectors = []
self.priorities = []
def identify_threats(self) -> list:
"""Identify threats relevant to the scenario."""
# Map scenario to OWASP LLM Top 10 categories
owasp_mapping = {
"function_calling": "LLM06 - Excessive Agency",
"system_prompt": "LLM01 - Prompt Injection",
"rag_documents": "LLM01 - Prompt Injection (Indirect)",
"user_data": "LLM02 - Insecure Output Handling",
"training_data": "LLM03 - Training Data Poisoning",
}
return self.threats
def prioritize_testing(self) -> list:
"""Prioritize testing vectors by risk."""
# Risk = Likelihood × Impact
return sorted(self.vectors, key=lambda v: v["risk_score"], reverse=True)
def generate_test_plan(self) -> dict:
"""Generate a structured test plan for the scenario."""
return {
"scope": self.scenario,
"threats": self.threats,
"test_cases": [
{
"vector": v["name"],
"technique": v["technique"],
"expected_result": v["expected"],
"priority": v["risk_score"],
}
for v in self.prioritize_testing()
],
}
紅隊發現某 LLM 客服代理可透過函式呼叫被操縱寄信至任意地址。依 OWASP LLM Top 10 2025,此發現應如何分類?
於 AI 紅隊作業中,你發現漏洞亦影響授權範圍之外的系統。正確的處置為何?
- OWASP LLM Top 10 2025 — LLM 安全風險完整指南(owasp.org/www-project-top-10-for-large-language-model-applications)
- MITRE ATLAS — AI 系統的對抗性威脅全景(atlas.mitre.org)
- HarmBench — 標準化評估框架(github.com/centerforaisafety/HarmBench)
- JailbreakBench — 越獄評估基準(github.com/JailbreakBench/jailbreakbench)
- NIST AI 600-1 — 用於風險管理的生成式 AI 概況
對本文所述攻擊類別,最有效的防禦策略為何?
儘管模型供應商持續強化安全,本文所述技巧為何仍持續有效?