# model-security
標記為「model-security」的 11 篇文章
AI 供應鏈事件回應
針對 AI 供應鏈妥協的事件回應程序,涵蓋模型倉儲、訓練管線與相依鏈。
ai-forensics-irsupply-chainincident-responsemodel-security
模型後門偵測鑑識
偵測、分析與歸因透過訓練階段或訓練後攻擊植入機器學習模型之後門的鑑識技術。
ai-forensics-irbackdoor-detectionmodel-securitytrojan-detection
微調模型中的後門偵測
偵測微調 AI 模型中的後門:激活分析、觸發條件掃描技術、行為探測策略,以及辨識隱藏惡意功能的統計方法。
backdoordetectionfine-tuningmodel-security
Capstone:開源模型安全稽核
Capstone 演練:對開源模型(Llama、Mistral、Qwen)的權重、微調與部署進行完整安全稽核。
capstonesecurity-auditopen-sourcemodel-securitysupply-chain
雲端 AI 模型市集風險
使用公有雲 AI 模型市集(AWS Marketplace、Azure Model Catalog、HuggingFace)的供應鏈與信任風險。
cloud-ai-securitymodel-marketplacesupply-chainmodel-securitytrojan-detection
微調安全
微調如何妥協模型安全的全面概覽——涵蓋資料集投毒、安全劣化、後門植入與獎勵駭客的攻擊分類,於微調 API 廣泛可得的時代。
fine-tuningsafetydataset-poisoningbackdoorreward-hackingrlhfloramodel-security
LoRA 與適配器攻擊面
對參數高效微調方法(包括 LoRA、QLoRA 與以適配器為基礎的做法)中安全漏洞的概覽——適配器的效率與可分享性如何建立新穎的攻擊向量。
loraqloraadapterpeftfine-tuningattack-surfacemodel-security
模型倉儲安全
模型倉儲(Hugging Face Hub、私人倉儲)的安全考量,包含存取控制、完整性與法遵。
supply-chainhugging-facemodel-securitybackdoorsignaturesdefense
模型深度剖析
為何模型特定知識對 AI 紅隊演練至關重要、不同架構如何產生不同的攻擊面,以及對任何新模型進行剖繪的系統化方法論。
model-securityred-teamingattack-surfacemethodologyarchitecture
開源權重模型安全
開源權重模型(包括 Llama、Mistral、Qwen 與 DeepSeek)之安全分析,涵蓋自完整權重存取、微調攻擊,與部署安全挑戰之獨特風險。
open-weightllamamistralqwendeepseekmodel-securityfine-tuning
訓練 Checkpoint 安全
保護訓練 checkpoint 的完整性與機密性,防止權重竊取與惡意修改。
training-pipelinecheckpointsmodel-securitysupply-chain