# persistence
標記為「persistence」的 18 篇文章
代理記憶投毒
將惡意內容注入代理記憶系統(對話歷史、RAG 儲存與向量資料庫)以達成持續性跨工作階段攻陷的技術。
流氓與影子代理
受攻擊、失準或未授權的 AI 代理如何在系統內運作——流氓代理以看似合法的身分執行有害行為,影子代理則是未經安全審查便部署的代理。
代理記憶投毒
投毒 AI 代理短期與長期記憶系統的技術,以達成持久入侵、注入行為後門,並於會話重置後存活。
跨工作階段持久化
跨工作階段在代理記憶體中建立持久存在的對抗性指令或狀態的技術。
記憶體壓縮利用
利用記憶體摘要與壓縮過程,使對抗性指令跨越壓縮循環持續存在。
記憶體刪除防止攻擊
使對抗性記憶體得以抵抗清理、刪除與清除作業的技術。
記憶體投毒
透過對代理記憶體儲存寫入惡意或誤導資料,以影響未來推理與行動的攻擊。
Backdoor Trigger Design
Methodology for designing effective backdoor triggers for LLMs, covering trigger taxonomy, poison rate optimization, trigger-target mapping, multi-trigger systems, evaluation evasion, and persistence through fine-tuning.
檢查點操控攻擊
在微調過程中攔截並修改模型檢查點,以植入持久後門或移除安全性質。
代理 記憶 注入 for Persistent Access
注入persistent instructions into agent memory systems that survive across conversation sessions.
實驗室: 代理 記憶 操控
動手實驗室,主題為injecting persistent instructions into an agent's memory與context that affect future interactions與conversations.
實驗室: Multi-Turn 攻擊 Campaigns
動手實驗室,主題為executing multi-turn crescendo attacks 對抗 LLMs,measuring safety degradation over conversation length,building persistent attack campaigns.
跨情境注入(提示詞注入)
跨越情境邊界持續存在的提示詞注入技術:於對話重置、工作階段切換、記憶體邊界與多代理交接中存活。
對抗性持久化機制
維持對 AI 系統持久存取的技術,包括對話記憶操弄、快取回應投毒與模型權重持久化。
AI 系統中的持久性
透過記憶、微調與上下文操控,在 AI 系統中取得持久存取與影響力。
Memory Persistence 攻擊 詳解
Walkthrough of achieving persistent memory manipulation in agent systems for cross-session influence.
記憶體 投毒 Step by Step
導覽 of persisting injection payloads in agent memory systems to achieve long-term compromise of LLM-based agents.
Memory Injection and Persistence 詳解
Walkthrough of injecting persistent instructions into agent memory systems that survive across sessions.