# agent-security
標記為「agent-security」的 20 篇文章
基於連結的外洩
使用超連結、重導向或 URL 參數從 AI 系統外洩資料,透過 markdown 連結、工具產生的 URL 與 API 回呼利用。
Markdown 圖片注入
注入帶有攻擊者控制 URL 的 markdown 圖片標籤,透過 HTTP 圖片請求外洩對話資料。
權限邊界繞過
透過範圍蔓延、隱含權限繼承與能力混淆,從受限權限提升至高權限的 AI 代理系統攻擊。
LangChain 安全性
LangChain 框架的安全性概觀,涵蓋鏈結操縱、工具套件漏洞與提示詞模板注入。
案例研究:MCP 工具投毒
針對 Model Context Protocol(MCP)伺服器的工具投毒攻擊分析,與生態系的信任模型挑戰。
CaMeL 與雙 LLM 模式
分離可信與不可信處理的架構式防禦模式:Simon Willison 的雙 LLM 概念與 Google DeepMind 的 CaMeL 框架,用於防禦使用工具的 AI 代理免於提示詞注入。
A2A 信任邊界攻擊
進階演練:利用 Agent-to-Agent (A2A) 協定在多代理系統中濫用代理間的信任邊界。
代理上下文溢位攻擊
演練如何透過灌滿代理的上下文視窗,把安全指令擠出 LLM 的注意力範圍,從而繞過系統提示詞與護欄。
代理迴圈劫持
進階詳解:劫持代理式迴圈以重新導向自主代理行為、改變推理鏈,並在多步驟代理工作流程中實現持久控制。
透過記憶體實現代理持久化
進階詳解:利用代理記憶體系統建立能在重啟、更新和工作階段邊界後仍存活的持久性後門。
MCP 回呼濫用
在代理與工具互動中濫用 MCP 回呼機制進行未授權行動、資料外洩和權限提升的進階詳解。
Function Calling Parameter Injection
導覽 of manipulating function call parameters through prompt-level techniques, injecting malicious values into LLM-generated API calls.
MCP 工具 Shadowing
進階 walkthrough of creating shadow tools that override legitimate MCP (模型 Context Protocol) tools, enabling interception and manipulation of agent-tool interactions.
記憶體 投毒 Step by Step
導覽 of persisting injection payloads in agent memory systems to achieve long-term compromise of LLM-based agents.
Multi-代理 Prompt Relay
進階 walkthrough of relaying prompt injection payloads across multiple agents in a pipeline, achieving cascading compromise of multi-agent systems.
Orchestrator Manipulation
進階 walkthrough of attacking the orchestrator layer in multi-agent systems to gain control over task delegation, agent coordination, and system-wide behavior.
Plugin Confusion 攻擊
導覽 of confusing LLM agents about which plugin or tool to invoke, causing them to call the wrong tool or pass data to unintended destinations.
工具 Call Injection
Step-by-step walkthrough of injecting malicious parameters into LLM tool and function calls to execute unauthorized actions in agent systems.
Sandboxing and Permission 模型s for 工具-Using 代理s
導覽 for implementing sandboxing and permission models that constrain tool-using LLM agents, covering least-privilege design, parameter validation, execution sandboxes, approval workflows, and audit logging.
安全 Testing LangChain Applications
Step-by-step walkthrough for identifying and exploiting security vulnerabilities in LangChain-based applications, covering chain injection, agent manipulation, tool abuse, retrieval poisoning, and memory extraction attacks.