# analysis
標記為「analysis」的 29 篇文章
MCP SSE 安全性分析
MCP Server-Sent Events (SSE) 傳輸層的安全分析,涵蓋注入、劫持與連線降級風險。
證據分析技術
用於分析從 AI 安全事件採集之鑑識證據的技術,包含日誌關聯、模式擷取與統計分析。
模型行為鑑識
對模型行為變化進行鑑識分析以偵測潛在妥協或操縱。
AI 故障根因分析
對 AI 系統故障進行根因分析的方法論,區分惡意攻擊、模型限制與環境因素。
案例研究:LangChain CVE 分析
分析 LangChain CVE(包含 CVE-2023-29374、CVE-2023-36258)及其根本原因。
事件教訓
跨已記錄 AI 安全事件彙整的共通教訓,以及對事件回應、紅隊與治理的意涵。
已發表紅隊報告分析
自 Anthropic、OpenAI、Google DeepMind 與 METR 之已發表紅隊報告深入分析。方法論分解、關鍵發現,與如何讀取並自專業紅隊評估學習。
案例研究
真實世界 AI 安全事件、領域特定案例研究、事件分析報告與平台安全評估,以實務經驗為理論知識奠基。
事件分析俱樂部
近期 AI 安全事件的社群分析,協作調查與記錄。
適配器層安全分析
針對以適配器為基礎的微調(包括 LoRA、prefix tuning 與 prompt tuning)所進行的安全分析。
PEFT 漏洞分析
LoRA 以外之參數高效微調方法的安全分析。
中國 AI 法規分析
Analysis of China's AI regulatory framework including the Algorithm Recommendation Regulation and GenAI measures.
英國 AI 法規分析
Analysis of the UK's pro-innovation approach to AI regulation and its implications for AI security.
China AI Regulation Analysis (Governance Compliance)
Analysis of China's AI regulatory framework including algorithmic recommendation rules and generative AI provisions.
Reward 模型 分析 實驗室
Analyze與exploit reward model biases to craft responses that score high on safety while embedding harmful content.
Lab: Injection Attempt Log Analysis
建構 a logging pipeline to capture and analyze injection attempts for pattern discovery and technique refinement.
提示詞 Structure 分析 實驗室
Reverse-engineer the prompt structure of target applications by analyzing response patterns與behavioral cues.
Lab: Analyzing Model Refusal Patterns
系統性 map model refusal patterns to understand safety training boundaries and identify potential bypasses.
Response 分析 Fundamentals
學習to analyze LLM responses for information leakage,inconsistencies,indicators of safety mechanism activation.
API Response Header 分析
分析HTTP response headers from LLM APIs to fingerprint providers,versions,middleware.
Response Timing Side-Channel 分析
Use response timing differences to infer information about model processing與guardrail activation.
實驗:以對數機率進行攻擊分析
利用 token 對數機率,擷取訓練資料、系統提示與模型內部相關的資訊。
Phi 模型家族安全性分析
Microsoft Phi 模型家族的安全性分析,涵蓋各版本與部署樣態。
Qwen 模型安全性分析
Qwen 系列 (含視覺與指令版本) 的安全性分析。
模型合併安全分析(訓練管道)
模型合併技術的安全分析,以及漏洞透過合併模型的傳播。
LLM Watermark Analysis 詳解
Walkthrough of detecting and analyzing watermarks in LLM-generated text using statistical methods.
AI 安全工具競品分析
針對紅隊作戰用途評估並比較 AI 安全工具的方法論。
任務後續分析方法論
進行完整的任務後續分析,包含經驗教訓、技術成效與方法論精進。
Deep Dive into Garak Scan Report Analysis
中階 walkthrough on analyzing garak scan reports, including JSONL parsing, false positive identification, vulnerability categorization, executive summary generation, and trend tracking.