What is MoE 路由操弄?

攻擊 Mixture-of-Experts 路由：專家選擇操弄、負載平衡利用、安全專家繞過，以及路由感知對抗輸入。

What is KV 快取投毒與利用?

KV 快取於 transformer 推論中如何運作、共享部署中的跨請求快取投毒、前綴快取攻擊，以及跨租戶資料洩漏。

What is 上下文視窗利用（訓練管線）?

上下文視窗上限作為攻擊面：上下文塞滿、注意力稀釋、lost-in-the-middle 攻擊，以及上下文長度如何影響注入成功率。

What is 推論最佳化攻擊?

推測解碼攻擊、批次處理漏洞、持續批次利用，以及速度最佳化如何於 LLM 推論中造就安全缺口。

What is 量化與壓縮攻擊?

量化（GPTQ、AWQ、GGUF）如何影響模型安全、精度損失造成的安全退化、量化感知對抗範例，以及壓縮攻擊面。

What is 基於蒸餾的模型擷取?

以知識蒸餾進行模型竊取：師生擷取攻擊、以 API 為基礎的蒸餾、任務特定擷取，以及對抗蒸餾式模型竊取的防禦。

What is 實作:利用量化後的模型?

動手實驗:比較不同量化等級下的攻擊成功率,在 FP16、INT8、INT4 上測試越獄,量測安全性退化,並設計量化感知的漏洞利用。

What is 模型蒸餾攻擊?

透過知識蒸餾竊取模型能力:基於 API 的蒸餾、繞過存取限制、任務專屬的能力盜竊,以及對蒸餾式模型盜竊的防禦。

架構層級攻擊

進階1 分鐘閱讀更新於 2026-03-15

鎖定模型架構最佳化的攻擊——涵蓋量化利用、蒸餾攻擊、KV 快取攻擊、MoE 路由操控與上下文視窗利用。

architecture quantization distillation kv-cache moe context-window

架構層級攻擊鎖定模型部署過程中應用的技術最佳化。量化、蒸餾、KV 快取管理與混合專家路由都引入可在理論模型行為與實務部署行為之間的落差中利用的漏洞。

量化利用

量化降低模型精度以改善推論效率。此精度降低改變決策邊界，可削弱安全對齊。詳見推論最佳化風險。

蒸餾攻擊

知識蒸餾訓練較小學生模型以模仿較大教師模型。安全對齊不完美轉移——學生模型可能學到能力而不學到拒絕。蒸餾也可用於模型竊取。

KV 快取攻擊

KV 快取儲存注意力計算的鍵值對。攻擊向量：跨請求快取洩漏（殘餘資料影響後續請求）、KV 快取萃取（從 GPU 記憶體讀取快取內容以重建對話）。詳見模型快取安全。

MoE 路由操控

混合專家模型將輸入路由至專業化專家子網路。攻擊者可打造輸入以繞過安全專業化專家——如果安全行為集中在特定專家，路由操控可避免觸發該專家。

上下文視窗攻擊

利用模型如何處理其上下文容量邊界處的輸入：超長輸入可導致截斷（安全指令被截掉）或效能退化（安全推理品質下降）。

架構層級攻擊

進階1 分鐘閱讀更新於 2026-03-15

鎖定模型架構最佳化的攻擊——涵蓋量化利用、蒸餾攻擊、KV 快取攻擊、MoE 路由操控與上下文視窗利用。

architecture quantization distillation kv-cache moe context-window

量化利用

量化降低模型精度以改善推論效率。此精度降低改變決策邊界，可削弱安全對齊。詳見推論最佳化風險。

蒸餾攻擊

知識蒸餾訓練較小學生模型以模仿較大教師模型。安全對齊不完美轉移——學生模型可能學到能力而不學到拒絕。蒸餾也可用於模型竊取。

KV 快取攻擊

MoE 路由操控

上下文視窗攻擊

利用模型如何處理其上下文容量邊界處的輸入：超長輸入可導致截斷（安全指令被截掉）或效能退化（安全推理品質下降）。

架構層級攻擊

量化利用

蒸餾攻擊

KV 快取攻擊

MoE 路由操控

上下文視窗攻擊

學習路徑

架構層級攻擊

量化利用

蒸餾攻擊

KV 快取攻擊

MoE 路由操控

上下文視窗攻擊

學習路徑

架構層級攻擊

學習路徑

相關文章

架構層級攻擊

學習路徑

相關文章