# distillation
標記為「distillation」的 14 篇文章
知識蒸餾攻擊
透過蒸餾攻擊與以查詢為基礎的擷取方式竊取教師模型的知識。
data-trainingdistillationtransferextraction
API 型模型萃取
深入探討透過系統化 API 查詢、主動學習策略、logprob 利用、軟標籤蒸餾,以及規避查詢異常偵測系統來萃取專有模型能力。
model-extractionapi-attacksdistillationactive-learninglogprobsquery-strategy
模型萃取與智慧財產竊盜
針對已部署 AI 系統的黑盒模型萃取、API 蒸餾、旁路攻擊、浮水印移除與模型指紋繞過方法論。
model-extractiondistillationside-channelwatermarkingfingerprintingip-theftapi-attacks
模型蒸餾的安全風險
知識蒸餾的安全風險,包括能力轉移、安全屬性損失以及未意圖的行為繼承。
frontierdistillationmodel-theft
模型蒸餾中的安全性損失
針對知識蒸餾過程中安全屬性損失的研究。
frontier-researchdistillationsafety-lossresearch
模型壓縮安全
模型壓縮(量化、剪枝、蒸餾)的安全意涵,包含後門保留與精度攻擊。
infrastructuremodel-compressionpruningquantizationdistillation
模型 Distillation 安全 實驗室
萃取model capabilities through distillation techniques using only 黑盒 API access.
distillationadvancedlabattacklabsmodel
推論最佳化風險
模型最佳化技術的安全意涵——涵蓋量化安全降級、剪枝漏洞引入、蒸餾攻擊與推測解碼風險。
quantizationpruningdistillationoptimizationinferencesafety-degradation
模型蒸餾的安全性分析
知識蒸餾如何影響學生模型的安全對齊與漏洞。
modelsdistillationteacher-studentsecurity
模型蒸餾攻擊
透過知識蒸餾竊取模型能力:基於 API 的蒸餾、繞過存取限制、任務專屬的能力盜竊,以及對蒸餾式模型盜竊的防禦。
distillationmodel-stealingapi-bypasscapability-theftintellectual-property
基於蒸餾的模型擷取
以知識蒸餾進行模型竊取:師生擷取攻擊、以 API 為基礎的蒸餾、任務特定擷取,以及對抗蒸餾式模型竊取的防禦。
distillationmodel-extractionmodel-theftstudent-teacherapi-extractionintellectual-property
架構層級攻擊
鎖定模型架構最佳化的攻擊——涵蓋量化利用、蒸餾攻擊、KV 快取攻擊、MoE 路由操控與上下文視窗利用。
architecturequantizationdistillationkv-cachemoecontext-window
知識蒸餾安全缺口
分析從教師模型到學生模型進行知識蒸餾時,安全屬性的流失。
trainingdistillationsafety-gap
知識蒸餾安全
知識蒸餾的安全意涵,包括能力萃取與安全對齊轉移。
attackspipelinedistillationknowledgetraining