# model
標記為「model」的 19 篇文章
GCP Model Garden 安全
GCP Model Garden 的安全評估,包括模型部署、版本控制與存取控制。
模型崩潰利用
利用迭代式合成訓練下模型崩潰現象的攻擊。
模型 Artifact 完整性
確保模型 Artifact 完整性,包含簽章、雜湊與供應鏈驗證。
模型 Distillation 安全 實驗室
萃取model capabilities through distillation techniques using only 黑盒 API access.
Reward 模型 分析 實驗室
Analyze與exploit reward model biases to craft responses that score high on safety while embedding harmful content.
模型 安全 Comparison 實驗室
Compare the security posture of different LLM models by running identical test suites across providers.
模型 Whisperer Challenge
萃取the exact 系統提示詞 from 8 progressively harder LLM applications using creative extraction techniques.
Practical 模型 Fingerprinting 實驗室
Fingerprint the underlying model behind an API endpoint to identify its type,version,configuration.
Multi-模型 流水線 攻擊 實驗室
攻擊 a pipeline where multiple models process data sequentially,exploiting trust between pipeline stages.
模型閘道安全模式
集中式模型閘道部署的安全模式,包括認證、授權與稽核。
模型回滾安全
模型回滾程序的安全意涵,包括暴露窗口與狀態一致性。
開放原始碼模型安全性比較
各開放原始碼 LLM 家族在安全對齊、紅隊結果與部署風險上的比較。
Phi 模型家族安全性分析
Microsoft Phi 模型家族的安全性分析,涵蓋各版本與部署樣態。
量化對安全性的衝擊
從對齊與防禦能力的觀點深入檢視量化對安全性的衝擊。
Qwen 模型安全性分析
Qwen 系列 (含視覺與指令版本) 的安全性分析。
模型合併安全分析(訓練管道)
模型合併技術的安全分析,以及漏洞透過合併模型的傳播。
模型供應鏈攻擊
從訓練資料到部署的模型供應鏈攻擊向量全面分析。
Vision Model 攻擊 詳解 (Attack 詳解)
Step-by-step walkthrough of visual prompt injection, adversarial images, and OCR exploitation in vision-language models.
Model Behavior Monitoring 設置
Set up comprehensive model behavior monitoring to detect drift, anomalies, and potential compromise.