推論最佳化風險

中級1 分鐘閱讀更新於 2026-03-15

模型最佳化技術的安全意涵——涵蓋量化安全降級、剪枝漏洞引入、蒸餾攻擊與推測解碼風險。

推論最佳化使模型更快、更便宜且更可部署。量化降低記憶體與運算需求。剪枝移除不必要的模型參數。蒸餾將知識轉移至較小模型。推測解碼增加生成速度。每種技術都以可能影響安全屬性的方式修改模型——安全對齊、對抗性穩健性與萃取漏洞。

量化安全意涵

量化將模型權重的數值精度從 32 位元或 16 位元浮點降至較低精度——8 位元整數（INT8）、4 位元整數（INT4）或更低。此精度降低改變模型的決策邊界，可能影響安全行為。

研究已顯示量化可削弱安全對齊。安全訓練模型透過精確平衡的權重設定維持其安全性。量化近似這些設定，而近似誤差可將決策邊界移位使安全繞過更容易。

訓練後量化（PTQ） 在訓練完成後應用量化，傾向有較大安全影響。量化感知訓練（QAT） 在訓練期間包含量化效應，通常更好保留安全。GPTQ 與 AWQ 是嘗試保留模型品質的熱門 LLM 特定量化方法，但品質保留不保證安全保留。

中級1 分鐘閱讀更新於 2026-03-15

模型最佳化技術的安全意涵——涵蓋量化安全降級、剪枝漏洞引入、蒸餾攻擊與推測解碼風險。