AI 安全框架概觀
AI 安全框架地景,包括 OWASP LLM Top 10、MITRE ATLAS、NIST AI RMF 與 EU AI Act。它們如何關聯、何時使用哪一個,以及缺口分析。
沒有任何單一框架能完整涵蓋 AI 安全風險的全貌。每個主流框架處理問題的不同切面:漏洞分類法、對抗戰術、風險管理流程,或法規遵循。有效的 AI 紅隊必須理解這些框架如何互補,並為每項委任選擇正確的組合。
框架地景
| 框架 | 組織 | 焦點 | 主要用途 |
|---|---|---|---|
| OWASP LLM Top 10 | OWASP | 常見 LLM 漏洞 | 漏洞分類、測試檢核表 |
| MITRE ATLAS | MITRE | 對抗式 ML 戰術與技術 | 攻擊建模、委任規劃 |
| NIST AI RMF | NIST | AI 風險管理生命週期 | 治理、風險評估、組織流程 |
| ISO 42001 | ISO | AI 管理系統 | 認證、管理系統落實 |
| EU AI Act | 歐盟 | 法規合規 | 法律合規、符合性評估 |
| NIST AI 600-1 | NIST | 生成式 AI 特有風險 | 生成式 AI 風險剖析 |
框架之間的關係
┌─────────────────────┐
│ 法規層 │
│ EU AI Act │
│ 美國行政命令 │
└────────┬────────────┘
│ 要求
┌────────▼────────────┐
│ 管理層 │
│ NIST AI RMF │
│ ISO 42001 │
└────────┬────────────┘
│ 落實為
┌──────────────┼──────────────┐
│ │ │
┌────────▼───┐ ┌──────▼──────┐ ┌─────▼──────┐
│ 漏洞分類法 │ │ 對抗建模 │ │ 測試標準 │
│ OWASP Top 10│ │ MITRE ATLAS│ │ NIST 600-1│
└─────────────┘ └─────────────┘ └────────────┘選擇合適的框架
依委任類型
| 委任類型 | 主要框架 | 輔助框架 |
|---|---|---|
| 漏洞評估 | OWASP LLM Top 10 | MITRE ATLAS 用於攻擊建模 |
| 完整紅隊委任 | MITRE ATLAS | OWASP 用於發現分類 |
| 合規稽核 | EU AI Act / NIST AI RMF | OWASP 用於技術測試 |
| 風險評估 | NIST AI RMF | ISO 42001 用於管理控管 |
| 認證支援 | ISO 42001 | NIST AI RMF 用於風險流程 |
| 生成式 AI 評估 | NIST AI 600-1 | OWASP LLM Top 10 用於漏洞 |
依對象
不同利害關係人講不同的框架語言:
| 對象 | 他們熟悉的框架 | 如何翻譯 |
|---|---|---|
| 資安工程師 | OWASP、MITRE ATT&CK | 對應至 OWASP 類別,將 ATLAS 視為 ATT&CK 延伸 |
| 風險主管 | NIST 框架、ISO 標準 | 以 RMF 風險類別呈現發現 |
| 法務 / 合規 | EU AI Act、業界法規 | 將發現對應至法規要求 |
| 高階主管 | 業務風險語言 | 將框架發現翻譯為業務影響 |
| AI/ML 工程師 | 學術文獻 | 引用論文、使用技術術語 |
框架涵蓋分析
每個框架都有盲點。理解這些缺口對於全面評估至關重要。
各框架各自擅長的領域
| 領域 | OWASP LLM | MITRE ATLAS | NIST AI RMF | EU AI Act |
|---|---|---|---|---|
| 提示注入 | 強 | 中 | 弱 | 中 |
| 模型擷取 | 中 | 強 | 弱 | 中 |
| 供應鏈 | 中 | 中 | 強 | 強 |
| 偏見 / 公平性 | 中 | 弱 | 強 | 強 |
| 對抗性樣本 | 弱 | 強 | 中 | 中 |
| 治理流程 | 弱 | 弱 | 強 | 強 |
| 事件回應 | 弱 | 中 | 強 | 中 |
| 資料投毒 | 中 | 強 | 中 | 中 |
| 隱私 / PII | 中 | 弱 | 強 | 強 |
框架共同的缺口
目前沒有任何框架足以涵蓋以下領域:
- 代理式 AI 風險:工具使用的利用、多步驟推理操弄、自主行動安全
- 多模型架構:串接多個 AI 模型的系統中的風險
- 湧現能力:規模達臨界點才浮現之能力的安全意涵
- 即時對抗適應:在委任過程中依模型回應即時修改技術的攻擊者
框架版本與更新
框架會演進。請追蹤這些更新週期:
| 框架 | 目前版本 | 更新週期 | 上次重大更新 |
|---|---|---|---|
| OWASP LLM Top 10 | v2.0 | 約每年 | 2025 |
| MITRE ATLAS | v4.x | 每季新增 | 持續進行中 |
| NIST AI RMF | 1.0 + AI 600-1 | 視需要 | 2024 |
| ISO 42001 | 2023 | 標準修訂週期 | 2023 |
| EU AI Act | 規則 2024/1689 | 實施法令持續 | 2024–2027 分階段 |
實務中組合框架
要進行全面的 AI 紅隊委任,請在不同階段組合使用不同框架:
規劃:MITRE ATLAS
以 ATLAS 戰術與技術建模威脅景觀並規劃攻擊情境。將目標系統攻擊面對應至 ATLAS 類別。
執行:OWASP LLM Top 10
以 OWASP Top 10 作為測試檢核表,確保常見漏洞類別皆被涵蓋。每項 OWASP 條目都暗示具體測試案例。
風險評估:NIST AI RMF
將發現放入 NIST AI RMF 風險類別的框架中,以傳達組織層級的風險姿態。將漏洞對應至 Govern、Map、Measure、Manage 四項功能。
合規對照:EU AI Act
對服務歐盟市場的組織,將發現對應至 EU AI Act 要求,以呈現合規缺口或符合情形。
報告:跨框架交叉引用
於報告中納入交叉引用,讓不同利害關係人能從其偏好的框架中找到發現。請參閱跨框架對照。
相關主題
- OWASP LLM Top 10 深度解析 -- 逐一分析 OWASP 類別
- MITRE ATLAS 導覽 -- 運用 ATLAS 規劃委任的實務
- NIST AI RMF 與 ISO 42001 -- 風險管理框架深入解析
- 跨框架對照參考 -- 統一分類法與速查表
參考資料
- "OWASP Top 10 for LLM Applications" - OWASP Foundation(2025)- 針對大型語言模型應用之業界標準漏洞分類法
- "MITRE ATLAS (Adversarial Threat Landscape for AI Systems)" - MITRE Corporation(2024)- 針對 AI 系統之對抗戰術與技術知識庫
- "NIST AI Risk Management Framework (AI RMF 1.0)" - National Institute of Standards and Technology(2023)- 管理 AI 生命週期風險的自願性框架
- "ISO/IEC 42001:2023 Artificial Intelligence Management System" - International Organization for Standardization(2023)- 建立與維持 AI 管理系統的可認證標準
- "EU Artificial Intelligence Act" - European Parliament(2024)- 涵蓋對抗測試要求的 AI 系統全面法規框架
為 AI 紅隊委任規劃攻擊情境時,下列哪個框架最適合用於建模對抗戰術與技術?