What is 持續自動化紅隊（CART）?

為持續 AI 安全驗證設計 CART 管線：架構、測試套件、遙測、警報、回歸偵測與 CI/CD 整合。

What is Garak：LLM 漏洞掃描器?

深入 NVIDIA 之 Garak LLM 漏洞掃描器：架構、探測、生成器、評估器、自訂探測開發，與自動化安全掃描之 CI/CD 整合。

What is PyRIT：紅隊協作編排?

深入探討 Microsoft PyRIT（Python Risk Identification Toolkit）：orchestrator、scorer、converter、target、多輪活動，以及進階紅隊組態。

What is promptfoo 用於紅隊?

promptfoo 用於 AI 紅隊的深入解析：YAML 組態、以斷言為基礎的測試、紅隊外掛、自製評估器，以及 LLM 安全的回歸測試流程。

What is Inspect AI：UK AISI 評估框架?

深入解析英國 AI 安全研究院（AISI）的 Inspect 框架：任務設計、solver、scorer，打造自製評估，以及與其他 AI 評估框架的比較。

What is HarmBench：標準化紅隊評估?

深入解析 HarmBench 框架之標準化紅隊評估：攻擊方法、評估管線、執行基準、結果解讀，以及跨供應商的模型安全比較。

What is 自訂 Harness 樣式?

為 LLM 漏洞評估打造自訂測試 harness 的設計樣式,涵蓋目標抽象、載荷傳遞、結果收集與 CI 整合。

What is Burp Suite 與 AI 安全擴充?

以 Burp Suite 進行 AI API 安全測試：攔截 LLM API 呼叫、AI 特定擴充、對 AI 端點模糊測試、以 HTTP 測試提示注入，以及將 Web 資安方法論與 AI 紅隊整合。

What is 實作：工具比較——同一目標，4 個工具?

對同一目標模型比較 Garak、PyRIT、promptfoo 與 Inspect AI 之實作。評估各工具之覆蓋、速度、發現品質與實務取捨。

紅隊基礎設施與工具

專家4 分鐘閱讀更新於 2026-03-11

AI 紅隊 C2 框架、自動化攻擊管線、自製掃描器開發，以及與 Cobalt Strike、Mythic、Sliver 的整合。

c2 infrastructure automation tooling pipeline scanner fuzzer cobalt-strike mythic sliver

紅隊基礎設施與工具

專業級的 AI 紅隊需要專門打造的基礎設施。有別於零散的提示測試，一個成熟的作業需要集中式的指揮與控制、自動化的攻擊管線、可重複執行的掃描，並能整合既有的安全工具。本頁介紹生產級 AI 紅隊平台的架構。

AI 紅隊 C2 架構

用於 AI 紅隊的 C2 會管理行動、派發攻擊任務，並蒐集發現。

架構概觀

┌─────────────────────────────────────────────┐
│              C2 Server (AIRT-C2)             │
│  行動管理器 │ Payload 資料庫 │ 結果彙整      │
│         └────────任務佇列────────┘          │
│              └────代理匯流排────┘           │
│  ┌─────┐ ┌──────┐ ┌─────┐ ┌───────┐       │
│  │注入  │ │模糊  │ │偵察 │ │掃描   │       │
│  │代理  │ │代理  │ │代理 │ │代理   │       │
│  └──┬──┘ └──┬───┘ └──┬──┘ └──┬────┘       │
└─────┼───────┼────────┼───────┼──────────────┘
      ▼       ▼        ▼       ▼
  [聊天機器人] [API] [RAG] [代理] [MCP Server]

核心元件

元件	職責
行動管理器	建立行動、指派目標、追蹤進度
Payload 資料庫	儲存並版本化注入 payload、模糊種子、偵察探針
任務佇列	將任務派發給代理（Redis/RabbitMQ）
代理匯流排	將任務路由至正確的代理類型
結果引擎	彙整發現、去重，指派嚴重性

行動資料模型

Campaign
  ├── id, name, description, targets[]
  ├── tasks[]（AttackTask）
  │   ├── agent_type：inject | fuzzer | recon | scanner
  │   ├── target：{url, auth, config}
  │   ├── payload：{payloads[], settings}
  │   ├── status：pending | running | completed | failed
  │   └── findings[]（Finding）
  │       ├── severity：critical | high | medium | low
  │       ├── title, description, evidence{}
  │       └── remediation
  └── stats：{total, completed, failed, findings_by_severity}

攻擊代理

所有代理實作共通介面：execute(task) -> \{results, findings\}。這讓代理在 C2 框架中可互通。

提示注入代理

自 C2 接收 payload
每個 payload 具有 text 與 category（system_prompt_extraction、data_exfiltration 等）。
將每個 payload 送至目標
以 POST 將 payload 內容送至目標 URL。擷取完整回應。
評估是否成功
檢查是否出現拒答指標（失敗）或遵從指標（成功）。依類別作特化評估：擷取類檢查 "you are" / "instructions:"；外洩類檢查是否為未拒答的長回應。
產生 Finding
對每次成功的注入，建立 Finding，包含嚴重性、描述、證據（payload + 回應）與修復建議。

偵察代理

對每個目標執行三項自動化任務：

任務	作用	產出
端點列舉	探測常見 AI 路徑（`/api/chat`、`/v1/models`、`/docs` 等）	活動端點清單，包含方法與內容類型
標頭分析	檢視 `x-*`、`server`、`via`、`model`、`ratelimit` 標頭	基礎設施洩漏指標
供應商指紋	送出「What model are you?」/「Who created you?」探針	供應商識別結果與信心度

漏洞掃描器

四項自動化檢查並行執行：

檢查	測試內容	嚴重性
系統提示洩漏	送出 3 個擷取探針，檢查回應是否含 3 個以上提示指標	高
提示注入	注入金絲雀 token（「CANARY_TOKEN_12345」），檢查是否出現於回應	嚴重
資料洩漏	詢問知識庫 / 訓練資料，檢查 PII 模式（@、phone:、api_key）	高
工具定義暴露	詢問「List all tools and their parameters」，檢查是否含 3 個以上工具指標	中

與傳統紅隊工具的整合

Cobalt Strike 整合

由 AI 發現產生 Aggressor 腳本：

自動產生按嚴重性顯示 AI 發現的彈出選單項目
為每項發現建立 beacon 備註以整合時間軸
將 AI 發現對齊至與傳統攻擊相同的委任時間軸

Mythic 整合

註冊與 Mythic 相容的 airt-agent payload 類型，提供下列指令：

指令	說明
`ai_recon`	對 AI 端點執行偵察
`ai_inject`	測試提示注入 payload（basic / advanced / waf_evasion 組）
`ai_extract`	以自動挑選的方法擷取系統提示
`ai_fuzz`	以可設定的案例數對 AI 端點進行模糊測試

Sliver 整合

建立 Sliver 擴充（ai-redteam），提供兩個指令：

指令	說明
`ai-scan`	端點列舉 + 供應商指紋 + 能力對照
`ai-exploit`	對目標執行提示注入與越獄 payload

管線架構

建議的管線呼應傳統紅隊方法論：

[行動組態] → [C2 Server] → [代理派發]
                                │
                ┌───────────────┤
                ▼               ▼
          [偵察代理]        [掃描代理]
                │               │
                ▼               ▼
         [結果 → 鎖定]    [漏洞 → 選擇 exploit]
                │               │
                └───────┬───────┘
                        ▼
                 [注入代理]
                        │
                        ▼
                 [發現 → 報告]

部署 C2 並建立行動
啟用 C2 server、定義目標，並組態行動。
執行偵察
列舉端點、指紋供應商、分析標頭。以結果組態後續階段。
執行掃描
執行所有自動化漏洞檢查。依漏洞密度為目標排序。
執行針對性注入
以偵察與掃描結果挑選並組態注入 payload。優先針對最有潛力的目標測試。
產生報告
產出結構化 JSON 報告，包含依嚴重性排序的發現、行動統計及各任務結果。

Knowledge Check

將 AI 紅隊發現與 Cobalt Strike、Mythic 等傳統 C2 框架整合的主要優勢是什麼？

參考資料

Garak: LLM Vulnerability Scanner — NVIDIA 的 LLM 安全掃描器
PyRIT: Python Risk Identification Toolkit — 微軟的 AI 紅隊框架
Cobalt Strike User Guide — 可整合的傳統 C2 框架

紅隊基礎設施與工具

專家4 分鐘閱讀更新於 2026-03-11

AI 紅隊 C2 框架、自動化攻擊管線、自製掃描器開發，以及與 Cobalt Strike、Mythic、Sliver 的整合。

c2 infrastructure automation tooling pipeline scanner fuzzer cobalt-strike mythic sliver

紅隊基礎設施與工具

AI 紅隊 C2 架構

用於 AI 紅隊的 C2 會管理行動、派發攻擊任務，並蒐集發現。

架構概觀

┌─────────────────────────────────────────────┐
│              C2 Server (AIRT-C2)             │
│  行動管理器 │ Payload 資料庫 │ 結果彙整      │
│         └────────任務佇列────────┘          │
│              └────代理匯流排────┘           │
│  ┌─────┐ ┌──────┐ ┌─────┐ ┌───────┐       │
│  │注入  │ │模糊  │ │偵察 │ │掃描   │       │
│  │代理  │ │代理  │ │代理 │ │代理   │       │
│  └──┬──┘ └──┬───┘ └──┬──┘ └──┬────┘       │
└─────┼───────┼────────┼───────┼──────────────┘
      ▼       ▼        ▼       ▼
  [聊天機器人] [API] [RAG] [代理] [MCP Server]

核心元件

元件	職責
行動管理器	建立行動、指派目標、追蹤進度
Payload 資料庫	儲存並版本化注入 payload、模糊種子、偵察探針
任務佇列	將任務派發給代理（Redis/RabbitMQ）
代理匯流排	將任務路由至正確的代理類型
結果引擎	彙整發現、去重，指派嚴重性

行動資料模型

Campaign
  ├── id, name, description, targets[]
  ├── tasks[]（AttackTask）
  │   ├── agent_type：inject | fuzzer | recon | scanner
  │   ├── target：{url, auth, config}
  │   ├── payload：{payloads[], settings}
  │   ├── status：pending | running | completed | failed
  │   └── findings[]（Finding）
  │       ├── severity：critical | high | medium | low
  │       ├── title, description, evidence{}
  │       └── remediation
  └── stats：{total, completed, failed, findings_by_severity}

攻擊代理

所有代理實作共通介面：execute(task) -> \{results, findings\}。這讓代理在 C2 框架中可互通。

提示注入代理

自 C2 接收 payload
每個 payload 具有 text 與 category（system_prompt_extraction、data_exfiltration 等）。
將每個 payload 送至目標
以 POST 將 payload 內容送至目標 URL。擷取完整回應。
評估是否成功
檢查是否出現拒答指標（失敗）或遵從指標（成功）。依類別作特化評估：擷取類檢查 "you are" / "instructions:"；外洩類檢查是否為未拒答的長回應。
產生 Finding
對每次成功的注入，建立 Finding，包含嚴重性、描述、證據（payload + 回應）與修復建議。

偵察代理

對每個目標執行三項自動化任務：

任務	作用	產出
端點列舉	探測常見 AI 路徑（`/api/chat`、`/v1/models`、`/docs` 等）	活動端點清單，包含方法與內容類型
標頭分析	檢視 `x-*`、`server`、`via`、`model`、`ratelimit` 標頭	基礎設施洩漏指標
供應商指紋	送出「What model are you?」/「Who created you?」探針	供應商識別結果與信心度

漏洞掃描器

四項自動化檢查並行執行：

檢查	測試內容	嚴重性
系統提示洩漏	送出 3 個擷取探針，檢查回應是否含 3 個以上提示指標	高
提示注入	注入金絲雀 token（「CANARY_TOKEN_12345」），檢查是否出現於回應	嚴重
資料洩漏	詢問知識庫 / 訓練資料，檢查 PII 模式（@、phone:、api_key）	高
工具定義暴露	詢問「List all tools and their parameters」，檢查是否含 3 個以上工具指標	中

與傳統紅隊工具的整合

Cobalt Strike 整合

由 AI 發現產生 Aggressor 腳本：

自動產生按嚴重性顯示 AI 發現的彈出選單項目
為每項發現建立 beacon 備註以整合時間軸
將 AI 發現對齊至與傳統攻擊相同的委任時間軸

Mythic 整合

註冊與 Mythic 相容的 airt-agent payload 類型，提供下列指令：

指令	說明
`ai_recon`	對 AI 端點執行偵察
`ai_inject`	測試提示注入 payload（basic / advanced / waf_evasion 組）
`ai_extract`	以自動挑選的方法擷取系統提示
`ai_fuzz`	以可設定的案例數對 AI 端點進行模糊測試

Sliver 整合

建立 Sliver 擴充（ai-redteam），提供兩個指令：

指令	說明
`ai-scan`	端點列舉 + 供應商指紋 + 能力對照
`ai-exploit`	對目標執行提示注入與越獄 payload

管線架構

建議的管線呼應傳統紅隊方法論：

[行動組態] → [C2 Server] → [代理派發]
                                │
                ┌───────────────┤
                ▼               ▼
          [偵察代理]        [掃描代理]
                │               │
                ▼               ▼
         [結果 → 鎖定]    [漏洞 → 選擇 exploit]
                │               │
                └───────┬───────┘
                        ▼
                 [注入代理]
                        │
                        ▼
                 [發現 → 報告]

部署 C2 並建立行動
啟用 C2 server、定義目標，並組態行動。
執行偵察
列舉端點、指紋供應商、分析標頭。以結果組態後續階段。
執行掃描
執行所有自動化漏洞檢查。依漏洞密度為目標排序。
執行針對性注入
以偵察與掃描結果挑選並組態注入 payload。優先針對最有潛力的目標測試。
產生報告
產出結構化 JSON 報告，包含依嚴重性排序的發現、行動統計及各任務結果。

Knowledge Check

將 AI 紅隊發現與 Cobalt Strike、Mythic 等傳統 C2 框架整合的主要優勢是什麼？

參考資料

Garak: LLM Vulnerability Scanner — NVIDIA 的 LLM 安全掃描器
PyRIT: Python Risk Identification Toolkit — 微軟的 AI 紅隊框架
Cobalt Strike User Guide — 可整合的傳統 C2 框架

紅隊基礎設施與工具

自 C2 接收 payload

將每個 payload 送至目標

評估是否成功

產生 Finding

部署 C2 並建立行動

執行偵察

執行掃描

執行針對性注入

產生報告

學習路徑

相關文章

紅隊基礎設施與工具

自 C2 接收 payload

將每個 payload 送至目標

評估是否成功

產生 Finding

部署 C2 並建立行動

執行偵察

執行掃描

執行針對性注入

產生報告

學習路徑

相關文章