# context-window
標記為「context-window」的 19 篇文章
上下文操縱
透過操縱代理的上下文視窗內容,以改變推理、覆寫指令或注入惡意優先順序的攻擊技術。
代理記憶系統安全
全面概述 AI 代理記憶架構及其安全意涵,涵蓋對話持久化、長期記憶儲存、上下文視窗管理與攻擊面。
記憶體上下文視窗攻擊
針對上下文視窗管理的攻擊,包括逐出操縱、符元預算耗盡與上下文位置利用。
對話保存
保存 AI 對話證據:互動日誌擷取、上下文視窗重建、多回合對話完整性、工具呼叫鏈保存,以及鑑識時間線建構。
上下文視窗安全評估
評估 of 上下文視窗 overflow、attention manipulation、long-context 利用技巧。
上下文視窗的內部機制
Transformer 上下文視窗中的注意力衰減、位置編碼限制與記憶管理如何創造可被紅隊操作利用的模式。
給漏洞利用開發者的 LLM 內部機制
從攻擊性安全視角看 Transformer 架構、分詞器內部機制、logit 管線與信任邊界。
Basic Context Window Overflow
Fill the context window with padding content to push safety instructions out of the attention window.
實驗室: 上下文 Window Overflow Attacks
動手lab exploring how overflowing a model's context window with padding content can push safety instructions out of the attention window與enable injection attacks.
實驗:上下文窗口攻擊最佳化
透過注意力動態,最佳化提示注入在上下文窗口中的擺放位置以最大化攻擊效果。
實驗室: 上下文 Window Stuffing Attacks
動手lab demonstrating how oversized inputs can overwhelm an LLM's context window to dilute safety instructions,push system prompts out of the attention window,or cause instruction amnesia.
上下文 Window Boundary 利用
利用 the boundaries of context windows to push safety instructions beyond the model's attention.
注意力利用
利用 transformer 注意力機制引導模型行為——涵蓋注意力稀釋、位置偏誤利用、注意力劫持與上下文視窗操控。
上下文溢位攻擊
以填塞內容填滿大型語言模型上下文視窗,把系統指令推出注意力之外,降低其對模型行為影響力的技術。
上下文視窗利用
利用大型語言模型上下文視窗機制的進階技術,包含注意力稀釋、位置編碼攻擊、KV 快取操控與上下文邊界混淆。
上下文視窗利用(訓練管線)
上下文視窗上限作為攻擊面:上下文塞滿、注意力稀釋、lost-in-the-middle 攻擊,以及上下文長度如何影響注入成功率。
架構層級攻擊
鎖定模型架構最佳化的攻擊——涵蓋量化利用、蒸餾攻擊、KV 快取攻擊、MoE 路由操控與上下文視窗利用。
代理上下文溢位攻擊
演練如何透過灌滿代理的上下文視窗,把安全指令擠出 LLM 的注意力範圍,從而繞過系統提示詞與護欄。
上下文視窗填充攻擊
填充 LLM 上下文視窗以將系統指令推出活躍記憶體的技術,透過操控符元預算來稀釋或取代防禦性提示詞。