# models
標記為「models」的 23 篇文章
AI 地景:紅隊員地圖
主要模型、提供者、部署模式,與自硬體至應用之 AI 堆疊——為當前 AI 生態系中之紅隊員定向。
CTF: Supply Chain Saboteur
Identify and exploit supply chain vulnerabilities in a model deployment pipeline. Find poisoned models, exploit malicious packages, and compromise the ML infrastructure.
架構比較:安全性觀點
從安全性觀點比較各種 LLM 架構,涵蓋 Transformer、MoE 與混合模型。
Command R 安全性分析
Cohere 的 Command R 模型在企業與檢索場景中的安全性分析。
模型蒸餾的安全性分析
知識蒸餾如何影響學生模型的安全對齊與漏洞。
Gemma 安全性深入剖析
Google Gemma 開放權重模型家族的深度安全性分析。
Mistral Nemo 安全性
Mistral Nemo 模型的安全性分析及其部署考量。
MoE 路由利用
如何利用專家混合模型的路由機制以偏置輸出或建立側通道。
多模態模型安全性比較
主要多模態 LLM 在攻擊面與防禦強度上的並列比較。
開放權重與 API 模型的安全性比較
開放權重模型與僅透過 API 存取的模型在安全性取捨上的比較。
Phi 模型安全性分析
Microsoft Phi 小型模型的安全性分析。
Phi 模型家族安全性分析
Microsoft Phi 模型家族的安全性分析,涵蓋各版本與部署樣態。
剪枝對安全性的影響
模型剪枝如何影響對齊強度與安全行為。
量化對安全性的影響
量化技術如何改變模型安全性、對齊行為與防禦強度。
Qwen 架構安全性
阿里巴巴 Qwen 模型家族的安全性特性與漏洞。
Qwen 模型安全性分析
Qwen 系列 (含視覺與指令版本) 的安全性分析。
推理模型安全性
推理模型 (如 o1、DeepSeek R1) 特有的安全性考量。
分詞器攻擊面
分詞器作為攻擊面,涵蓋字元邊界、Unicode 與詞彙漏洞。
Yi 模型安全性評估
零一萬物 Yi 系列模型的安全性評估與漏洞觀察。
模型 API 比較表
主要 LLM API 功能、安全控制與速率限制的並排比較(OpenAI、Anthropic、Google 等供應商)。
測試 AI21 Labs 模型
AI21 Labs Jamba 模型(含長上下文與效率特性)的紅隊測試指南。
測試 Cohere 模型
Cohere Command-R 系列模型(含 RAG 與工具使用特性)的紅隊測試指南。
測試 Mistral AI 模型
Mistral AI 模型的完整紅隊測試指南,涵蓋 Mixtral MoE 架構與聊天端點。