Loading...
標記為「attention-manipulation」的 2 篇文章
透過操縱代理的上下文視窗內容,以改變推理、覆寫指令或注入惡意優先順序的攻擊技術。
演練如何透過灌滿代理的上下文視窗,把安全指令擠出 LLM 的注意力範圍,從而繞過系統提示詞與護欄。