Loading...

代理安全模擬測驗

進階5 分鐘閱讀更新於 2026-03-20

模擬測驗聚焦於代理式 AI 安全包括 MCP、A2A、函式呼叫、多代理 threats。

assessments practice security exam agent

評估總覽

模擬測驗聚焦於 agentic AI security包括 MCP, A2A, function calling、多agent threats.

評估詳情:

題數: 15
建議時間: 45 分鐘
通過門檻: 70%
難度等級:進階

作答說明

請仔細閱讀每道題目並充分審視所有選項後再作答。許多題目存在多個看似合理的答案——請選擇最能顧及完整情境的最佳答案。

情境題作答建議:

辨識情境中的關鍵限制與目標
思考已掌握與缺乏的資訊
就情境的具體要求評估每個選項
選出在有效性、安全性與專業度之間最平衡的選項

第 1 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 2 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 3 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 4 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 5 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 6 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 7 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 8 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 9 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 10 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 11 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 12 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 13 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 14 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

第 15 題

Knowledge Check

在 AI 紅隊評估的脈絡下,哪種做法最能完整評量目標系統的安全態勢?

計分與建議

分數	等級	後續步驟
90-100%	專家	可進入下一階段;可考慮指導他人
80-89%	熟練	有少量不足;針對答錯主題複習
70-79%	勝任	合格;進階前複習答錯領域
60-69%	發展中	顯著不足;回頭複習相關章節
60% 以下	基礎	完成先備內容後再重考

複習指引

完成本評估後,請複習所有題目的解析——包含答對的題目。理解答案為何正確與知道答案同樣重要,解析常含有能加深主題理解的額外脈絡。

對於答錯的題目:

辨識題目涵蓋的主題領域
複習對應的課程章節
完成任何相關的實作練習
複習後再重新作答題目

進階考量

演變中的攻擊樣貌

AI 安全態勢隨攻擊技巧與防禦措施演進而快速變化。若干趨勢形塑當前局勢:

模型能力提升創造新攻擊面。 隨模型取得工具、程式碼執行、網頁瀏覽與電腦使用能力,每項新能力帶入過去純文字系統不存在的可能利用向量。最小權限原則在模型能力擴展時益發重要。

安全訓練改良必要但不足。 模型供應商大量投入 RLHF、DPO、憲法式 AI 等對齊技巧的安全訓練。這些改良提高成功攻擊門檻,但未消除根本漏洞:模型無法可靠區分合法與對抗性指令,因為此區分並未在架構中表徵。

自動化紅隊工具使測試普及化。 NVIDIA 的 Garak、Microsoft 的 PyRIT、Promptfoo 讓組織無需深厚 AI 安全專業即可進行自動化測試。然而自動化工具僅攔截已知模式;新型攻擊與業務邏輯漏洞仍需人類創意與領域知識。

法規壓力推動組織投入。 EU AI Act、NIST AI RMF 及產業專屬法規日益要求組織評估並緩解 AI 專屬風險。此壓力推動 AI 安全計畫投入,但許多組織仍處於建立成熟 AI 安全實務的初期。

跨領域安全原則

以下安全原則貫穿本課程所有主題:

縱深防禦:無任何單一防禦足夠。應疊加多層獨立防禦,使任一層失敗皆不致系統淪陷。輸入分類、輸出過濾、行為監控與架構控制皆應就位。
假設已被入侵:設計系統時假設任一元件可能被攻陷。此思維帶來更佳隔離、監控與事件回應能力。一旦提示詞注入得逞,應以架構控制將影響半徑降至最小。
最小權限:僅給予模型與代理完成其用途所需的最小能力。客服聊天機器人不需檔案系統存取或程式碼執行。過多能力會放大成功利用的影響。
持續測試:AI 安全非一次性評估。模型更動、防禦演進、新型攻擊不時出現。應將持續安全測試納入開發與部署生命週期。
預設安全:預設組態應安全。高風險能力需明確啟用,使用允許清單而非拒絕清單,寧限制而不放行。

與組織安全的整合

AI 安全不獨立存在——必須融入組織更廣泛的安全計畫:

安全領域	AI 專屬整合
身分與存取	API 金鑰管理、模型存取控制、AI 功能的使用者認證
資料保護	訓練資料分類、提示詞中的 PII、模型呼叫的資料駐留
應用安全	AI 功能威脅模型、SAST/DAST 中的提示詞注入、安全 AI 設計模式
事件回應	AI 專屬作業手冊、模型行為監控、提示詞注入鑑識
合規	AI 法規對應(EU AI Act、NIST)、AI 稽核軌跡、模型文件
供應鏈	模型來源、依賴安全、轉接器/權重完整性驗證

class OrganizationalIntegration:
    """Framework for integrating AI security with organizational security programs."""
 
    def __init__(self, org_config: dict):
        self.config = org_config
        self.gaps = []
 
    def assess_maturity(self) -> dict:
        """Assess the organization's AI security maturity."""
        domains = {
            "governance": self._check_governance(),
            "technical_controls": self._check_technical(),
            "monitoring": self._check_monitoring(),
            "incident_response": self._check_ir(),
            "training": self._check_training(),
        }
        overall = sum(d["score"] for d in domains.values()) / len(domains)
        return {"domains": domains, "overall_maturity": round(overall, 1)}
 
    def _check_governance(self) -> dict:
        has_policy = self.config.get("ai_security_policy", False)
        has_framework = self.config.get("risk_framework", False)
        score = (int(has_policy) + int(has_framework)) * 2.5
        return {"score": score, "max": 5.0}
 
    def _check_technical(self) -> dict:
        controls = ["input_classification", "output_filtering", "rate_limiting", "sandboxing"]
        active = sum(1 for c in controls if self.config.get(c, False))
        return {"score": active * 1.25, "max": 5.0}
 
    def _check_monitoring(self) -> dict:
        has_monitoring = self.config.get("ai_monitoring", False)
        has_alerting = self.config.get("ai_alerting", False)
        score = (int(has_monitoring) + int(has_alerting)) * 2.5
        return {"score": score, "max": 5.0}
 
    def _check_ir(self) -> dict:
        has_playbook = self.config.get("ai_ir_playbook", False)
        return {"score": 5.0 if has_playbook else 0.0, "max": 5.0}
 
    def _check_training(self) -> dict:
        has_training = self.config.get("ai_security_training", False)
        return {"score": 5.0 if has_training else 0.0, "max": 5.0}

未來方向

若干研究與產業趨勢將形塑本領域演進:

AI 安全的形式方法:發展能對對抗條件下模型行為提供有限保證的數學框架
大規模自動化紅隊演練:持續改進的自動化測試工具,能在無人類指導下發現新型漏洞
AI 協助防禦:以 AI 系統偵測並回應對其他 AI 系統的攻擊,形成動態攻防生態
標準化評估:標準化基準(HarmBench、JailbreakBench)的採用日增,使進展衡量一致
法規調和:各司法管轄區 AI 法規框架趨同,為組織提供更清晰要求

參考資料與延伸閱讀

OWASP LLM Top 10 2025 — LLM 安全風險完整指南(owasp.org/www-project-top-10-for-large-language-model-applications)
MITRE ATLAS — AI 系統的對抗性威脅全景(atlas.mitre.org)
HarmBench — 標準化評估框架(github.com/centerforaisafety/HarmBench)
JailbreakBench — 越獄評估基準(github.com/JailbreakBench/jailbreakbench)
NIST AI 600-1 — 用於風險管理的生成式 AI 概況

Knowledge Check

對本文所述攻擊類別,最有效的防禦策略為何?

Knowledge Check

儘管模型供應商持續強化安全,本文所述技巧為何仍持續有效?

在 GitHub 上編輯此頁