# classification
標記為「classification」的 13 篇文章
AI 事件分類框架
依類型、嚴重性與回應優先順序分類 AI 資安事件的框架。
標籤翻轉攻擊
標籤翻轉攻擊的實務技巧及其對不同機器學習架構的效能。
AI 攻擊分類
依目標、技術與影響組織之 AI 攻擊完整分類——為紅隊規劃與報告提供共享詞彙。
注入偵測研究
注入偵測的前沿研究,包括困惑度法、分類器方法與集成技術。
2025 年注入攻擊分類法
涵蓋所有已知攻擊類別之最新 LLM 注入攻擊分類法。
新型注入類別
探討不符合傳統分類法的新興注入類別,包括結構性、時序性與跨系統注入向量。
Lab: Injection Detection Tool
建構 a basic 提示詞注入 detection tool using pattern matching, heuristics, and LLM-based classification to identify malicious inputs before they reach the target model.
發現嚴重度分類
標準化 AI 安全發現嚴重度分類框架,包含風險評分方法與業務衝擊評估。
提示詞注入分類
提示詞注入攻擊的完整分類框架,涵蓋直接與間接向量、遞送機制、目標層級與嚴重度評估,用於系統化紅隊測試。
攻擊技術分類法參考
AI 安全攻擊技術的完整分類法,交叉對應 MITRE ATLAS、OWASP LLM Top 10 與自訂分類方案。
AI 漏洞分類系統
依類型、影響與可利用性為 AI 特有漏洞分類的結構化系統。
Classifying AI 漏洞 Severity
Framework for consistently classifying the severity of AI and LLM vulnerabilities, with scoring criteria, impact assessment, and examples across common finding categories.
將發現對應至 OWASP LLM Top 10
將 AI 紅隊發現對應至 OWASP LLM 應用程式 Top 10 的實作詳解,涵蓋分類指引、報告範本與緩解對應。