# red-team
標記為「red-team」的 45 篇文章
AI 紅隊證據蒐集
AI 紅隊演練的系統化證據蒐集方法論,包含成品保存、發現文件化與保管鏈程序。
紅隊 Methodology 評估 (評估 - W2)
評估涵蓋scoping、攻擊 trees、evidence collection、professional reporting。
完整紅隊委任:端對端
自範圍至攻擊執行、證據蒐集、影響評估、報告遞送與補救驗證之 AI 紅隊委任完整指南。
AI 紅隊報告寫作
撰寫 AI 紅隊報告:執行摘要、發現範本、AI 適配風險評級、補救建議,與要避免之常見錯誤。
頂石專案:完整紅隊演練專案
針對包含聊天機器人、RAG、代理與 API 各層的多元件 AI 應用,進行完整 AI 紅隊演練的範圍界定、規劃、執行與報告撰寫。
Amazon Bedrock 紅隊方法論
對 Amazon Bedrock 的完整紅隊方法論:模型呼叫 API 濫用、guardrails 繞過、自訂模型端點利用、IAM 錯誤組態、知識庫投毒與 Bedrock agents 利用。
AWS AI 服務安全概觀
為 AWS AI 服務之紅隊方法論,含 Bedrock、SageMaker、Comprehend 與 Rekognition:服務列舉、攻擊面對應與利用技術。
Amazon SageMaker 攻擊
針對 Amazon SageMaker 訓練管道、模型端點與筆記本環境的攻擊分析。
AWS Bedrock 安全深度剖析
對 AWS Bedrock 的進階安全評估,涵蓋模型呼叫控制、Guardrails 繞過測試、VPC 配置,以及基礎模型 API 的紅隊方法論。
Azure ML 攻擊
針對 Azure Machine Learning 工作區、計算與已部署端點的攻擊向量。
Azure OpenAI 安全
Azure OpenAI Service 的安全態勢,包括內容過濾、托管身分與私有端點。
Microsoft Defender for AI(AI 防禦)
Microsoft Defender for AI 的能力、部署與威脅偵測分析,涵蓋 Azure OpenAI、生成式 AI 工作負載與對抗性濫用偵測。
Azure AI 服務安全概觀
為 Azure AI 服務之紅隊方法論,含 Azure OpenAI、Azure ML、AI Studio 與 Cognitive Services:服務列舉、受管身分濫用與攻擊面對應。
AI 成本與帳單攻擊
AI 成本利用的紅隊技術:模型呼叫濫用以灌水帳單、符元耗竭攻擊、GPU 運算濫用、自動擴展利用,以及跨雲端服務商的錢包阻斷攻擊。
GCP AI 服務安全概觀
GCP AI 服務(包括 Vertex AI、Model Garden 與 AI Platform)之紅隊方法論:服務枚舉、服務帳號攻擊,以及攻擊面繪製。
Model Garden 風險
自 GCP Model Garden 部署模型之安全風險:第三方模型信任、模型來源驗證、自未受信任來源之部署,與供應鏈攻擊向量。
Vertex AI 攻擊面
為 Vertex AI 之紅隊方法論:預測端點濫用、自訂訓練安全缺口、特徵儲存投毒、模型監控逃避與管線利用。
跨雲 AI 攻擊
利用多雲 AI 部署中跨雲信任關係、身分聯合與資料傳輸的攻擊。
多雲 AI 安全概覽
多雲 AI 部署的安全風險:跨雲攻擊面、憑證管理挑戰、不一致的安全控制,以及 AWS、Azure 與 GCP AI 服務間的治理缺口。
2026 年 11 月:完整委任挑戰
完成自範圍界定至最終報告交付之現實紅隊委任模擬,產出專業級交付物。
月度競賽:紅藍對抗
每月一對一競賽,紅隊嘗試突破藍隊建立的防禦,依攻擊複雜度與防禦穩健度評分。
紅隊演練驅動的防禦改善
運用紅隊演練發現,系統性地改善 LLM 應用的防禦。
紅隊與藍隊不對稱
為何攻擊 AI 系統在根本上比防禦它們更容易:不對稱優勢、防禦者困境,以及縮小差距的策略。
Mapping Red Team Activities to Regulations
Mapping AI red team activities to specific regulatory requirements for compliance evidence.
AI 基礎設施的滲透測試方法論
針對 AI/ML 系統的結構化滲透測試方法論,涵蓋偵查、漏洞評估、利用與報告撰寫。
Lab: Building an Automated Red Team Pipeline
建構 a complete automated 紅隊演練 pipeline with attack generation, execution, scoring, and reporting.
Building a Custom Red Team Harness
建構 a complete red team testing harness with parallel execution, logging, and scoring.
Building a Red Team Results Dashboard
建構real-time dashboard for tracking與visualizing red team campaign results across targets與techniques.
Promptfoo Red Team Test Suite Development
Build完整的 red team test suites in Promptfoo with custom graders與multi-model targeting.
完整案件模擬
端對端紅隊案件模擬,複製真實世界 AI 安全評估,從範圍界定到報告交付。
模擬:客戶聊天機器人紅隊
針對客戶服務聊天機器人的完整紅隊案件模擬,涵蓋提示詞注入、資料洩漏與政策違規測試。
專業實務
AI 紅隊實務人員的專業技能,涵蓋紅隊營運、報告撰寫與溝通、職涯發展,以及建構組織 AI 紅隊計畫。
紅隊實驗室與營運
AI 紅隊演練的營運基礎:實驗室環境、證據處理、案件工作流程,以及專業 AI 安全評估的團隊管理。
AI 紅隊演練快速參考表
常見 AI 紅隊技術、載荷與工具指令的快速參考表。
AI 紅隊的 OPSEC(作業安全)
AI 紅隊演練的作業安全,包括 API 金鑰管理與歸因規避。
Continuous 紅隊演練 Programs
Designing and operating ongoing AI red team programs with automated testing pipelines, metrics dashboards, KPI frameworks, alert-driven assessments, and integration with CI/CD and model deployment workflows.
紅隊 Methodology 概覽
A structured methodology for AI red team engagements: phases, deliverables, role definitions, and how AI-specific testing differs from traditional penetration testing.
Red Team-Defense Feedback Loop
Build a continuous red team-defense improvement loop with automated testing and metric tracking.
Azure OpenAI 紅隊 導覽
Complete red team walkthrough for Azure OpenAI deployments: testing content filters, managed identity exploitation, prompt flow injection, data integration attacks, and Azure Monitor evasion.
AWS Bedrock 紅隊 導覽
Complete guide to red teaming AWS Bedrock deployments: testing guardrails bypass techniques, knowledge base data exfiltration, agent prompt injection, model customization abuse, and CloudTrail evasion.
Vertex AI 紅隊 導覽 (Platform 導覽)
Complete red team walkthrough for Google Vertex AI: testing prediction endpoints, 模型 Garden assessments, Feature Store probing, and exploiting Vertex AI 代理s and Extensions.
Automating 紅隊 Evaluations with Promptfoo
Complete walkthrough for setting up automated red team evaluation pipelines using Promptfoo, covering configuration, custom evaluators, adversarial dataset generation, CI integration, and result analysis.
Promptfoo 紅隊評測
配置 Promptfoo 進行完整紅隊評測,含自訂斷言與評分器。
Promptfoo End-to-End 導覽
Complete walkthrough of promptfoo for AI red teaming: configuration files, provider setup, running evaluations, red team plugins, assertion-based scoring, reporting, and CI/CD integration.
Microsoft PyRIT for Orchestrated Multi-Turn 攻擊s
Comprehensive walkthrough for using Microsoft PyRIT to design and execute orchestrated multi-turn attack campaigns against LLM applications, covering orchestrator configuration, converter chains, scoring strategies, and campaign analysis.