越獄技術評量

中級2 分鐘閱讀更新於 2026-03-15

以 10 道中級題目測試你對 LLM 越獄方法、繞過策略以及繞過安全訓練機制的知識。

本評量評估你對用於繞過 LLM 安全訓練、對齊機制與內容過濾的越獄技術的理解。在嘗試本評量之前，你應熟悉角色扮演攻擊、基於編碼的混淆、多輪升級，以及使越獄成為可能的底層機制。

Knowledge Check

越獄與提示詞注入之間的根本差異為何？

Knowledge Check

為何角色扮演與基於人格的越獄（如「DAN」技術）經常成功對抗指示調整模型？

Knowledge Check

什麼是「多樣本越獄」？為何它特別利用大型上下文視窗？

Knowledge Check

攻擊者以 Base64 編碼有害請求，然後請求模型解碼並遵循指示。為何這繞過許多已部署的安全系統？

Knowledge Check

越獄中的「漸強」或多輪升級技術為何？

Knowledge Check

什麼使「前綴注入」技術作為越獄方法有效？

Knowledge Check

為何越獄技術常具模型特定性，在針對不同 LLM 家族時需要調整？

Knowledge Check

什麼是「Token 走私」？它如何規避基於關鍵字的安全過濾器？

Knowledge Check

什麼是「相反日」或「否定反轉」越獄技術？

Knowledge Check

從防禦角度，哪種方法對最廣泛的越獄技術提供最穩健的保護？

概念摘要