What is 剖析 AI 系統?

透過行為分析與指紋識別，辨識目標 AI 系統的模型、供應商、版本、安全組態與能力。

What is 系統提示擷取?

從 AI 應用中擷取隱藏系統提示的技術，揭露安全規則、工具定義、行為約束與敏感組態。

What is 繪製模型能力?

有系統地發掘並繪製 AI 系統完整能力面的做法，涵蓋工具、整合、權限與隱藏功能。

What is 模型辨識技術?

以行為簽名、輸出分析與系統化探測對 API 後之模型進行指紋辨識，以判定模型家族、大小與版本。

What is AI API Enumeration?

Discovering AI API endpoints, parameters, model configurations, and undocumented features through systematic enumeration techniques.

What is 針對 AI 系統的社交工程?

透過社交工程技術操弄 AI 系統的人員與管理者，以取得存取、擷取資訊，或繞過安全控管。

What is AI 紅隊的 OSINT?

自公開來源蒐集關於 AI 部署的情資：文件、徵才啟事、研究論文、社群媒體與技術產物。

What is Shadow AI 偵測?

找出組織中未授權 AI 部署：偵測方法、常見 shadow AI 模式，以及對未受管理 AI 風險之評估。

What is AI 攻擊面繪製?

辨識 AI 系統中所有攻擊向量之系統化方法論：輸入通道、資料流、工具整合與信任邊界。

What is LLM API Enumeration?

進階 techniques for enumerating LLM API capabilities, restrictions, hidden parameters, and undocumented features to build a comprehensive attack surface map.

AI 紅隊演練方法論

Beginner2 min readUpdated 2026-03-12

AI 紅隊案件的結構化方法論，涵蓋偵察、目標剖析、攻擊規劃，以及區分專業評估的技藝。

methodology recon tradecraft red-teaming assessment

有效的 AI 紅隊演練遵循結構化方法論，就像傳統滲透測試一樣。隨機的提示詞注入嘗試，遠不如從徹底偵察開始、逐步建構至目標性利用的系統化方法有效。

AI 紅隊演練生命週期

1. Scope & Planning → 2. Reconnaissance → 3. Target Profiling →
4. Attack Planning → 5. Exploitation → 6. Post-Exploitation → 7. Reporting

階段 1：範圍與規劃

界定範圍內項目、成功的定義，以及交戰規則。AI 特有的範圍考量包含：

哪些模型與應用程式在範圍內？
是否允許測試微調／訓練資料？
供應鏈攻擊（模型註冊表、相依性）是否在範圍內？
「成功」的越獄或注入如何定義？
如何評估隨機結果？

階段 2：偵察

在不直接與 AI 系統互動的情況下，蒐集目標資訊。參閱目標剖析。

階段 3：目標分析

與系統互動以理解其行為：

系統提示詞萃取 ——發掘系統的指令與限制
能力對應 ——描繪系統能做的事，包含工具與整合

階段 4-7：攻擊與報告

依偵察結果規劃攻擊、執行、記錄結果並報告發現。完整案件方法論參閱總結專案。

關鍵技藝原則

原則	說明
攻擊前先剖析	投入時間理解目標，再嘗試利用
系統化測試	一次只變動一個參數，以理解何者有效與為何有效
萬物皆記錄	AI 行為為隨機——記錄確切提示詞、回應與成功率
以開源模型作為替身	在針對生產系統前先於開源權重模型測試技術
尊重速率限制	激進測試會觸發速率限制，亦可能警示防禦者

偵察深度

偵察的深度決定了您攻擊的品質：

偵察深度	您會學到什麼	攻擊品質
無	「這是個聊天機器人」	隨機注入嘗試
基本	模型系列、可見功能	針對該模型類型的泛用攻擊
中等	系統提示詞、工具、安全規則	針對特定防禦的目標性攻擊
深入	架構、訓練資料來源、部署細節	針對特定弱點的客製化利用

從本節各頁開始建立您的偵察能力，然後在完整案件的脈絡中，以總結專案方法論加以應用。

參考文獻

Greshake et al., "Not What You've Signed Up For: Compromising Real-World LLM-Integrated Applications with Indirect Prompt Injection" (2023) ——以偵察為本的間接注入
Perez & Ribeiro, "Ignore This Title and HackAPrompt: Exposing Systemic Weaknesses of LLMs" (2023) ——系統化發掘大型語言模型弱點的方法
MITRE, "ATLAS: Adversarial Threat Landscape for AI Systems" (2023) ——AI 系統的結構化偵察框架

Knowledge Check

為何嘗試提示詞注入攻擊前，偵察是重要的？

AI 紅隊演練方法論

Beginner2 min readUpdated 2026-03-12

AI 紅隊案件的結構化方法論，涵蓋偵察、目標剖析、攻擊規劃，以及區分專業評估的技藝。

methodology recon tradecraft red-teaming assessment

AI 紅隊演練生命週期

1. Scope & Planning → 2. Reconnaissance → 3. Target Profiling →
4. Attack Planning → 5. Exploitation → 6. Post-Exploitation → 7. Reporting

階段 1：範圍與規劃

界定範圍內項目、成功的定義，以及交戰規則。AI 特有的範圍考量包含：

哪些模型與應用程式在範圍內？
是否允許測試微調／訓練資料？
供應鏈攻擊（模型註冊表、相依性）是否在範圍內？
「成功」的越獄或注入如何定義？
如何評估隨機結果？

階段 2：偵察

在不直接與 AI 系統互動的情況下，蒐集目標資訊。參閱目標剖析。

階段 3：目標分析

與系統互動以理解其行為：

系統提示詞萃取 ——發掘系統的指令與限制
能力對應 ——描繪系統能做的事，包含工具與整合

階段 4-7：攻擊與報告

依偵察結果規劃攻擊、執行、記錄結果並報告發現。完整案件方法論參閱總結專案。

關鍵技藝原則

原則	說明
攻擊前先剖析	投入時間理解目標，再嘗試利用
系統化測試	一次只變動一個參數，以理解何者有效與為何有效
萬物皆記錄	AI 行為為隨機——記錄確切提示詞、回應與成功率
以開源模型作為替身	在針對生產系統前先於開源權重模型測試技術
尊重速率限制	激進測試會觸發速率限制，亦可能警示防禦者

偵察深度

偵察的深度決定了您攻擊的品質：

偵察深度	您會學到什麼	攻擊品質
無	「這是個聊天機器人」	隨機注入嘗試
基本	模型系列、可見功能	針對該模型類型的泛用攻擊
中等	系統提示詞、工具、安全規則	針對特定防禦的目標性攻擊
深入	架構、訓練資料來源、部署細節	針對特定弱點的客製化利用

從本節各頁開始建立您的偵察能力，然後在完整案件的脈絡中，以總結專案方法論加以應用。

參考文獻

Greshake et al., "Not What You've Signed Up For: Compromising Real-World LLM-Integrated Applications with Indirect Prompt Injection" (2023) ——以偵察為本的間接注入
Perez & Ribeiro, "Ignore This Title and HackAPrompt: Exposing Systemic Weaknesses of LLMs" (2023) ——系統化發掘大型語言模型弱點的方法
MITRE, "ATLAS: Adversarial Threat Landscape for AI Systems" (2023) ——AI 系統的結構化偵察框架

Knowledge Check

為何嘗試提示詞注入攻擊前，偵察是重要的？

AI 紅隊演練方法論

AI 紅隊演練生命週期

階段 1：範圍與規劃

階段 2：偵察

階段 3：目標分析

階段 4-7：攻擊與報告

關鍵技藝原則

偵察深度

相關主題

參考文獻

Learning Path

AI 紅隊演練方法論

AI 紅隊演練生命週期

階段 1：範圍與規劃

階段 2：偵察

階段 3：目標分析

階段 4-7：攻擊與報告

關鍵技藝原則

偵察深度

相關主題

參考文獻

Learning Path

AI 紅隊演練方法論

Learning Path

Related articles

AI 紅隊演練方法論

Learning Path

Related articles