# model-extraction
標記為「model-extraction」的 19 篇文章
模型萃取與隱私評量
以 9 道題目測試你對模型萃取、模型竊取、成員推論與針對 AI 系統之智慧財產竊取攻擊的進階知識。
案例研究:真實世界的模型萃取
分析針對商用 ML API 的模型萃取攻擊案例。
資料與訓練安全
AI 資料管線中的安全漏洞,涵蓋 RAG 利用、訓練資料攻擊、模型萃取與智慧財產盜竊,以及對已部署模型的隱私攻擊。
API 型模型萃取
深入探討透過系統化 API 查詢、主動學習策略、logprob 利用、軟標籤蒸餾,以及規避查詢異常偵測系統來萃取專有模型能力。
模型萃取與智慧財產竊盜
針對已部署 AI 系統的黑盒模型萃取、API 蒸餾、旁路攻擊、浮水印移除與模型指紋繞過方法論。
旁路模型攻擊
深入探討透過時序分析、快取型攻擊、功耗/電磁旁路、嵌入端點利用與架構指紋辨識,推論模型架構、規模與部署細節。
浮水印與指紋規避
深入探討偵測與移除輸出浮水印、退化權重浮水印、規避模型指紋辨識、建立出處剝離管線,以及理解模型所有權驗證的法律格局。
嵌入模型萃取
透過查詢 API 萃取或複製專有嵌入模型。
演算法交易 AI 攻擊
AI 驅動交易系統的攻擊技術,包含透過對抗輸入進行市場操縱、從交易 API 萃取模型、誘發閃崩、情緒分析投毒。
醫療影像 AI 攻擊
醫療影像 AI 系統的對抗攻擊,包含對 X 光、CT、MRI 的擾動、GAN 產生的假醫療影像,以及從診斷影像 API 萃取模型。
LLM API 的速率限制策略
LLM API 的速率限制策略,包含符元預算、濫用防禦與公平性。
Model Extraction via API Access
Extract a functionally equivalent model using only API query access.
模型 萃取 via Knowledge Distillation
萃取a functionally equivalent model from a commercial API using systematic distillation queries.
實驗室: Basic 模型 萃取
動手實驗室,主題為API-based 模型萃取 attacks,querying a target model to approximate its behavior,measuring fidelity,understanding query budgets.
從多模態系統中萃取模型
透過視覺、音訊和跨模態查詢策略,從多模態 AI 系統中萃取模型能力、權重和架構細節的技術。
擷取訓練資料
透過針對性查詢與成員推論攻擊,從 LLM 中擷取已記憶之訓練資料、系統提示與私密資訊的技術。
基於蒸餾的模型擷取
以知識蒸餾進行模型竊取:師生擷取攻擊、以 API 為基礎的蒸餾、任務特定擷取,以及對抗蒸餾式模型竊取的防禦。
Model Extraction 攻擊 詳解
Walkthrough of extracting model weights/behavior through systematic API querying.
AWS SageMaker 紅隊演練
End-to-end walkthrough for red teaming ML models deployed on AWS SageMaker: endpoint enumeration, IAM policy analysis, model extraction testing, inference pipeline exploitation, and CloudTrail log review.