# skill-verification
標記為「skill-verification」的 39 篇文章
評估與技能驗證
驗證 AI 紅隊知識的完整評估套件,包含章節評估、練習考試、學習指南與動手技能驗證練習。
技能驗證概覽
AI 紅隊計時技能驗證實驗室概覽,包含格式、通過/失敗標準與準備指引。
技能驗證: A2A 協定攻擊
實務技能驗證的多代理信任邊界攻擊、協定利用。
技能驗證: Agent 利用
實務技能驗證的agent、MCP 利用技巧。
技能驗證: 自動化紅隊演練
Practical verification of automated 攻擊 generation using Garak、PyRIT、Promptfoo。
技能驗證: 雲端 AI 安全
Practical verification of 雲端 AI platform 安全評估 skills。
技能驗證: 雲端 AI 安全 (評估)
針對以下的實作驗證:雲端 AI service 安全評估跨 AWS、Azure、GCP。
技能驗證: 防禦有效性 Evaluation
Practical verification of skills in evaluating guardrails、classifiers、monitoring systems。
技能驗證: Defense Evaluation
針對以下的實作驗證:ability to evaluate、bypass LLM 防禦 mechanisms。
技能驗證: Encoding、Obfuscation
Skill verification的Base64、Unicode、token smuggling、encoding-based bypass技巧。
技能驗證: 函式呼叫攻擊
Skill verification的schema injection、parameter manipulation、result poisoning技巧。
技能驗證: 治理、Compliance
Verification of skills in AI 治理 framework implementation、audit、compliance 評估。
技能驗證: AI 事件回應
Skill verification的AI-specific incident detection、analysis、containment、recovery。
技能驗證: AI System 橫向移動
Skill verification的moving from compromised AI components to connected systems、data stores。
技能驗證: MCP 利用
動手實作技能驗證的MCP transport 攻擊、tool description injection、server impersonation。
技能驗證: 代理記憶攻擊
Practical verification of 記憶投毒、context manipulation、cross-session persistence skills。
技能驗證: 多模態 Attack Execution
針對以下的實作驗證:image injection、audio manipulation、cross-modal transfer 攻擊。
技能驗證: 多模態攻擊
針對以下的實作驗證:多模態攻擊 capabilities 跨 image、audio、document modalities。
技能驗證: 提示詞注入
動手實作技能驗證 requiring live 利用 of 提示詞注入漏洞。
技能驗證: RAG & Data 攻擊
Practical verification of RAG poisoning、embedding 攻擊、data extraction技巧。
技能驗證: Reasoning Model 攻擊
Verification of skills in reasoning trace manipulation、chain-of-thought 利用、thinking-token 攻擊。
技能驗證: 紅隊 Reporting
Practical 評估 of 紅隊報告撰寫、finding communication skills。
技能驗證: 進階報告撰寫
Verification of advanced 紅隊報告撰寫包括 executive summaries、technical details、remediation。
技能驗證: 工具熟練度
針對以下的實作驗證:proficiency與Garak、PyRIT、Promptfoo、custom tooling。
技能驗證: 訓練管線安全
Skill verification的資料投毒、RLHF 利用、微調攻擊技巧。
技能驗證:代理利用(評量)
限時技能驗證實驗室:在 25 分鐘內透過操控工具使用利用代理系統執行未授權動作。
技能驗證:防禦實作
限時技能驗證實驗室:在 45 分鐘內建構通過自動化攻擊測試的可運作護欄系統。
技能驗證:越獄
限時技能驗證實驗室:在 30 分鐘內使用越獄技術繞過防禦 AI 系統的安全措施。
技能驗證:提示詞注入(評估)
計時技能驗證實驗室:使用提示詞注入技術在 15 分鐘內從防禦 AI 系統萃取系統提示詞。
技能驗證:偵察
計時技能驗證實驗室:在 20 分鐘內透過識別模型、萃取設定並描繪能力,剖析未知的 AI 系統。
技能驗證:報告撰寫
限時技能驗證實驗室:在 30 分鐘內從提供的證據撰寫專業 AI 紅隊發現報告。
技能驗證: Embedding 攻擊
Practical verification of embedding、向量資料庫攻擊 capabilities。
技能驗證: Fine-Tuning 攻擊 (評估)
Practical verification of 微調攻擊 capabilities包括 alignment removal、backdoor insertion。
技能驗證: AI 鑑識 Investigation
針對以下的實作驗證:AI 鑑識 investigation capabilities與simulated incident scenarios。
技能驗證: 治理 Audit (評估)
Practical verification of AI 治理 audit skills against EU AI Act、NIST AI RMF requirements。
技能驗證: Guardrail Bypass
針對以下的實作驗證:護欄繞過技巧跨 NeMo、LLM Guard、custom implementations。
技能驗證: MCP 利用 (評估)
針對以下的實作驗證:MCP server 利用包括 tool poisoning、resource manipulation。
技能驗證: Multi-Agent Testing
針對以下的實作驗證:多代理 system 安全 testing capabilities。
技能驗證: 紅隊 Automation
Practical verification of 紅隊自動化 skills using Garak、PyRIT、custom tooling。