What is 完整紅隊委任：端對端?

自範圍至攻擊執行、證據蒐集、影響評估、報告遞送與補救驗證之 AI 紅隊委任完整指南。

What is 委任規劃與範疇界定?

如何規劃並界定 AI 紅隊委任的範圍，包括目標設定、交戰規則、成功判準與方法論選擇。

What is 執行與報告?

如何執行 AI 紅隊委任並交付專業發現，包括證據蒐集、統計回報，以及修復指引。

What is Capstone:完整聊天機器人演練?

完整 Capstone 演練:對生產級聊天機器人系統進行完整紅隊演練。

What is Capstone:多代理系統評估?

Capstone 演練:對具 MCP 與 A2A 的多代理平台進行端對端安全評估。

What is Capstone:企業 RAG 評估?

Capstone 演練:對具角色型存取控制之企業 RAG 系統的完整紅隊評估。

What is Capstone:醫療 AI 評估?

Capstone 演練:具 HIPAA 與病患安全要求的醫療 AI 系統安全評估。

What is Capstone:金融 AI 評估?

Capstone 演練:對具監管合規要求之金融 AI 顧問的紅隊評估。

What is Capstone:程式碼助理評估?

Capstone 演練:對具 repository 與 CI/CD 存取權之 AI 程式碼助理的安全評估。

What is Capstone:多模態系統評估?

Capstone 演練:處理影像、文件與文字之多模態 AI 系統的紅隊評估。

完整案件方法論

中級2 分鐘閱讀更新於 2026-03-12

進行完整 AI 紅隊案件的全面方法論，將先前章節的所有技術整合為結構化專業評估。

capstone engagement methodology red-teaming professional

本總結專案章節將前七章的所有內容匯集為一套連貫方法論，用於進行專業的 AI 紅隊案件。一次完整案件不只是一堆個別攻擊的集合——它是一場結構化評估，系統性地衡量 AI 系統的安全姿態。

案件階段

專業 AI 紅隊案件遵循六個階段：

Phase 1: Planning & Scoping
    ↓
Phase 2: Reconnaissance
    ↓
Phase 3: Vulnerability Discovery
    ↓
Phase 4: Exploitation & Validation
    ↓
Phase 5: Analysis & Impact Assessment
    ↓
Phase 6: Reporting & Remediation

各階段詳細內容：

規劃與界定範圍 ——界定範圍、交戰規則、成功標準與方法論
執行與報告 ——執行評估、記錄發現與交付結果

AI 紅隊演練的獨特之處

面向	傳統滲透測試	AI 紅隊
發現	確定性（漏洞存在或不存在）	機率性（成功率）
範圍	系統、網路、應用程式	模型、提示詞、資料管線、工具
工具	掃描器、利用程式、腳本	載荷、模糊測試、分類器
報告	CVE、CVSS 分數	攻擊分類、成功率、影響鏈
修復	修補、配置	重新訓練、護欄、架構變更
重測	二元（已修復／未修復）	統計（成功率已充分降低？）

評估矩陣

以「攻擊類別 × 目標元件」的評估矩陣來組織案件：

	模型	系統提示詞	工具	資料管線	基礎設施
注入	越獄	覆寫	濫用	RAG 投毒	API 利用
萃取	訓練資料	提示詞洩漏	工具列舉	資料存取	配置洩漏
規避	安全繞過	過濾器繞過	認證繞過	驗證繞過	WAF 繞過
阻斷	資源耗盡	上下文溢位	工具洪水	資料損毀	服務阻斷

每一格代表一項測試類別。並非所有格子都適用於每場案件，但此矩陣能確保全面覆蓋。

關鍵交付物

專業案件會產出：

高階摘要 ——非技術性的發現與風險概覽
技術報告 ——包含載荷、成功率與證據的詳細發現
攻擊面地圖 ——系統元件及其安全姿態的完整對應
修復路徑圖 ——附工作量估計的優先順序建議
回歸測試套件 ——自動化測試，用以驗證修復並偵測回歸

從何開始

請從規劃與界定範圍開始，學習如何正確建立案件，接著進入執行與報告學習營運方法論。

參考文獻

NIST, "AI Risk Management Framework" (2023) ——聯邦級 AI 風險評估框架
OWASP, "Top 10 for Large Language Model Applications" (2025) ——業界標準的大型語言模型風險分類
Anthropic, "Challenges in Red Teaming AI Systems" (2024) ——AI 紅隊演練的方法論考量
MITRE, "ATLAS: Adversarial Threat Landscape for AI Systems" (2023) ——用以組織評估的全面威脅框架

Knowledge Check

為何 AI 紅隊報告需要成功率，而不僅是二元通過／失敗的發現？

完整案件方法論

中級2 分鐘閱讀更新於 2026-03-12

進行完整 AI 紅隊案件的全面方法論，將先前章節的所有技術整合為結構化專業評估。

capstone engagement methodology red-teaming professional

案件階段

專業 AI 紅隊案件遵循六個階段：

Phase 1: Planning & Scoping
    ↓
Phase 2: Reconnaissance
    ↓
Phase 3: Vulnerability Discovery
    ↓
Phase 4: Exploitation & Validation
    ↓
Phase 5: Analysis & Impact Assessment
    ↓
Phase 6: Reporting & Remediation

各階段詳細內容：

規劃與界定範圍 ——界定範圍、交戰規則、成功標準與方法論
執行與報告 ——執行評估、記錄發現與交付結果

AI 紅隊演練的獨特之處

面向	傳統滲透測試	AI 紅隊
發現	確定性（漏洞存在或不存在）	機率性（成功率）
範圍	系統、網路、應用程式	模型、提示詞、資料管線、工具
工具	掃描器、利用程式、腳本	載荷、模糊測試、分類器
報告	CVE、CVSS 分數	攻擊分類、成功率、影響鏈
修復	修補、配置	重新訓練、護欄、架構變更
重測	二元（已修復／未修復）	統計（成功率已充分降低？）

評估矩陣

以「攻擊類別 × 目標元件」的評估矩陣來組織案件：

	模型	系統提示詞	工具	資料管線	基礎設施
注入	越獄	覆寫	濫用	RAG 投毒	API 利用
萃取	訓練資料	提示詞洩漏	工具列舉	資料存取	配置洩漏
規避	安全繞過	過濾器繞過	認證繞過	驗證繞過	WAF 繞過
阻斷	資源耗盡	上下文溢位	工具洪水	資料損毀	服務阻斷

每一格代表一項測試類別。並非所有格子都適用於每場案件，但此矩陣能確保全面覆蓋。

關鍵交付物

專業案件會產出：

高階摘要 ——非技術性的發現與風險概覽
技術報告 ——包含載荷、成功率與證據的詳細發現
攻擊面地圖 ——系統元件及其安全姿態的完整對應
修復路徑圖 ——附工作量估計的優先順序建議
回歸測試套件 ——自動化測試，用以驗證修復並偵測回歸

從何開始

請從規劃與界定範圍開始，學習如何正確建立案件，接著進入執行與報告學習營運方法論。

參考文獻

NIST, "AI Risk Management Framework" (2023) ——聯邦級 AI 風險評估框架
OWASP, "Top 10 for Large Language Model Applications" (2025) ——業界標準的大型語言模型風險分類
Anthropic, "Challenges in Red Teaming AI Systems" (2024) ——AI 紅隊演練的方法論考量
MITRE, "ATLAS: Adversarial Threat Landscape for AI Systems" (2023) ——用以組織評估的全面威脅框架

Knowledge Check

為何 AI 紅隊報告需要成功率，而不僅是二元通過／失敗的發現？

完整案件方法論

案件階段

AI 紅隊演練的獨特之處

評估矩陣

關鍵交付物

從何開始

相關主題

參考文獻

學習路徑

完整案件方法論

案件階段

AI 紅隊演練的獨特之處

評估矩陣

關鍵交付物

從何開始

相關主題

參考文獻

學習路徑

完整案件方法論

學習路徑

相關文章

完整案件方法論

學習路徑

相關文章