# testing
標記為「testing」的 56 篇文章
章節評估概覽
如何使用 AI 紅隊章節評估、評分方法論與建議完成順序。
Capstone:設計並實作 AI 安全基準測試套件
打造完整、可重現的基準測試套件,評估 LLM 在多個風險維度(毒性、偏見、幻覺與對抗穩健性)上的安全性。
Azure AI Content Safety 測試
測試 Azure AI Content Safety 服務的繞過漏洞與組態弱點。
AI 生成測試的安全缺口
分析 AI 生成的測試套件如何系統性地遺漏安全相關測試案例,製造危險的覆蓋率錯覺。
進階測試生成操縱
操縱 AI 測試生成的進階技術,使測試看似充分實則漏洞仍在。
內容安全 API(Azure、OpenAI、Google)
Azure Content Safety、OpenAI Moderation API 與 Google Cloud 安全服務之詳細比較,含 API 結構、類別分類、嚴重性等級、測試方法論與常見缺口。
防禦評估方法論
評估 AI 防禦對已知攻擊類別之有效性的系統化方法論。
紅隊自動化
大規模自動化 AI 紅隊的框架與工具,涵蓋 CART 管線、越獄模糊測試、回歸測試與持續監控。
覆蓋追蹤系統
為 AI 安全評估實作測試覆蓋追蹤,確保跨攻擊向量與模型行為的全面評估。
防禦評估工具包
打造工具包,系統性評估 LLM 防禦的有效性。
對 LLM 應用進行 Fuzzing
將 fuzzing 方法套用於 LLM 應用,包括以文法為基礎、以突變為基礎與覆蓋導引取徑。
多模型測試編排器
跨多個模型與提供者編排平行安全測試,找出跨模型漏洞與可轉移攻擊。
多目標測試框架
打造框架以同時在多個模型提供者上測試同一攻擊套件。
promptfoo 用於紅隊
promptfoo 用於 AI 紅隊的深入解析:YAML 組態、以斷言為基礎的測試、紅隊外掛、自製評估器,以及 LLM 安全的回歸測試流程。
AI 安全的迴歸測試
為 AI 安全屬性實作自動化迴歸測試,可整合進 CI/CD 管道並捕捉安全退化。
微調下的對齊穩定性
測試安全對齊如何在各種微調設定與資料集下劣化。
AI 稽核方法論
AI 系統的全面稽核方法論,涵蓋規劃、證據蒐集、測試程序、報告範本,以及與紅隊評估的整合。
EU AI Act Compliance Testing
EU AI Act risk categories, testing requirements for high-risk AI systems, conformity assessment procedures, and how red teaming supports EU AI Act compliance.
LLM API 安全測試
LLM API 的安全測試方法論,涵蓋認證、速率限制、輸入驗證、輸出過濾與 LLM 特有的 API 漏洞。
Lab: API Authentication Security Testing
測試 LLM API authentication mechanisms for vulnerabilities including 符元 leakage, replay attacks, and scope bypass.
Lab: API-Based Model Testing
學習 to test 語言模型 through their APIs including OpenAI, Anthropic, and local Ollama endpoints. 建構 reusable API testing functions with proper error handling.
Basic Automated 測試 Setup
Set up automated prompt testing with Python scripts to scale your security evaluation beyond manual testing.
Basic 防禦 Mechanism 測試
Identify與categorize the defensive mechanisms present in a target LLM application through structured probing.
Instruction Hierarchy Testing
測試 how models prioritize conflicting instructions between system, user, and assistant roles.
Lab: Multi-Language Prompt Testing
測試 LLM safety boundaries across multiple languages to identify inconsistencies in safety training coverage.
LLM Playground 安全 測試
Use web-based LLM playgrounds to practice basic injection techniques without API setup requirements.
Lab: Prompt Template Vulnerability Testing
測試 common prompt template patterns for injection vulnerabilities including string interpolation and placeholder abuse.
實作:回應一致性測試
測試 LLM response consistency across repeated queries to identify non-deterministic safety boundary behavior.
Lab: Running Safety Benchmarks
Run standardized safety benchmarks against LLM models to establish baseline safety profiles for comparison.
實作:建構 AI 模糊測試器
建構 a comprehensive fuzzing framework for large 語言模型 that 系統性地 generates malformed, unexpected, and 對抗性 inputs to discover crashes, unexpected behaviors, and safety bypasses.
Deceptive 對齊 測試 框架
建構testing framework for detecting mesa-optimization與deceptive alignment in fine-tuned models.
實驗:代理工作流程安全測試
測試多步代理工作流程的注入點、狀態操弄與未授權的動作執行。
實驗:金絲雀 Token 有效性測試
在系統提示中部署並測試金絲雀 token,評估其偵測提示擷取的有效性。
實驗:雲端 AI 平台安全測試
測試雲端 AI 平台組態,包含 AWS Bedrock guardrails、Azure 內容過濾器與 GCP 安全設定。
實驗:AI 合規測試基礎
以結構化測試程序,依 OWASP LLM Top 10 與 NIST AI RMF 的要求測試 LLM 應用。
實驗:會話隔離測試
測試多租戶 LLM 部署中的會話隔離,偵測跨會話的資料外洩與脈絡污染。
Claude Testing Methodology
Systematic methodology for red teaming Claude models, including API probing, model card analysis, safety boundary mapping, and comparative testing across Opus, Sonnet, and Haiku tiers.
Gemini Testing Methodology
Systematic methodology for red teaming Gemini, including Vertex AI API probing, Google AI Studio testing, multimodal test case design, and grounding attack validation.
GPT-4 測試方法論
為紅隊 GPT-4 之系統化方法論,含 API 基探測技術、速率限制考量、內容政策對應與安全邊界發現。
Promptfoo 組態指南
為 LLM 安全測試組態 Promptfoo 的詳細指南,包含供應商設定、測試斷言與 CI/CD 整合。
Automated 防禦 Regression Testing
Build automated regression tests for LLM security defenses using attack replay and continuous monitoring.
Automated 防禦 Testing Pipeline
Build an automated pipeline that continuously tests defensive measures against evolving attack techniques.
合規導向測試方法論
將法規要求對應至具體測試案例,以支援合規導向的 AI 紅隊評估。
Testing for EU AI Act Compliance
導覽 for conducting red team assessments that evaluate compliance with the EU AI Act requirements, covering risk classification, mandatory testing obligations, and documentation requirements.
多模型測試方法論
為處理流程中使用多個 LLM 模型的應用程式,建立結構化測試方法論。
AI 合規測試方法論
針對法規合規要求(含 EU AI Act 與 NIST)測試 AI 系統的方法論。
測試 AI21 Labs 模型
AI21 Labs Jamba 模型(含長上下文與效率特性)的紅隊測試指南。
測試 Cohere 模型
Cohere Command-R 系列模型(含 RAG 與工具使用特性)的紅隊測試指南。
測試 Fireworks AI 平台
Fireworks AI(含函式呼叫與複合 AI 系統)的紅隊測試指南。
測試 Groq 推論平台
Groq 高速推論平台及其安全特性的紅隊測試指南。
測試 Mistral AI 模型
Mistral AI 模型的完整紅隊測試指南,涵蓋 Mixtral MoE 架構與聊天端點。
測試 Ollama 本地部署
透過 Ollama 本地部署模型的安全測試指南,含網路暴露面與 API 安全。
測試 Replicate 代管模型
針對 Replicate 代管模型(含開源模型部署)的紅隊測試指南。
測試 Together AI 平台
Together AI(含微調模型端點與自訂部署)的紅隊測試指南。
Counterfit ML 安全測試
使用 Microsoft Counterfit 對部署的模型端點進行對抗性 ML 測試。
JailbreakBench 使用與結果提交
使用 JailbreakBench 評估越獄技術並將結果提交至基準測試。