# agents
標記為「agents」的 49 篇文章
代理委派攻擊
利用多代理委派模式透過冒用與不安全代理間通訊達成橫向移動、權限提升與命令控制。
代理目標劫持
透過投毒輸入、間接提示詞注入與多步驟操控以重導 AI 代理目標的技術——OWASP 2026 Agentic Top 10 排名第一的風險。
代理身分與憑證竊取
利用 AI 代理向外部服務認證的方式——透過代理操弄、MFA 繞過與冒充攻擊(包含 BodySnatcher 與 CVE-2025-64106)進行憑證竊取。
代理記憶投毒
將惡意內容注入代理記憶系統(對話歷史、RAG 儲存與向量資料庫)以達成持續性跨工作階段攻陷的技術。
代理供應鏈攻擊
透過被投毒的套件、被植入後門的 MCP 伺服器、惡意模型註冊表與武器化的代理框架攻陷 AI 代理——包含 Postmark MCP 入侵事件與 NullBulge 攻擊行動。
自主目標漂移
自主 AI 代理如何透過獎勵駭入、規格遊戲、安全系統繞過與多代理系統中的連鎖失效偏離原定目標。
操弄推理鏈
影響 AI 代理的 chain-of-thought 推理,將其規劃、決策與工具選擇導向攻擊者期望結果的技術。
函式呼叫利用
針對 OpenAI 函式呼叫、Anthropic 工具使用與類似 API 的實務攻擊——透過提示詞注入注入函式呼叫、利用參數驗證落差與鏈結呼叫。
代理與代理式利用
自主 AI 代理的安全概覽,涵蓋由工具呼叫、持久記憶體、多步推理與多代理協調所建立的擴大攻擊面。
MCP 安全:理解並防禦協定
模型上下文協定 (MCP) 安全的完整指南——理解攻擊面、已知漏洞 (2026 年初超過 30 個 CVE),並為啟用 MCP 的 AI 代理系統實作穩健防禦。
攻擊多代理系統
針對多代理架構的攻擊技術,涵蓋代理間注入、信任邊界破壞、連鎖入侵,以及 A2A 協定攻擊。
流氓與影子代理
受攻擊、失準或未授權的 AI 代理如何在系統內運作——流氓代理以看似合法的身分執行有害行為,影子代理則是未經安全審查便部署的代理。
利用代理工具使用
如何操弄 AI 代理,使其以攻擊者可控的參數呼叫工具,並濫用其能力達成資料外洩、提權,以及未授權動作。
工具使用利用
利用 AI 代理如何呼叫外部工具與 API 的完整技術,包含工具描述投毒、過度寬鬆存取濫用與工具輸出操控。
零點擊代理入侵
AI 代理在無任何使用者互動下遭入侵的攻擊——處理惡意內容即觸發自主執行、資料外洩與系統入侵。
API 編排器攻擊
針對協調多個 API 呼叫的 AI 代理的攻擊技術,包括跨 API 呼叫鏈的參數注入、多 API 工作流程中的混淆代理攻擊,以及利用被編排服務之間的信任關係。
瀏覽器代理利用
針對控制網頁瀏覽器的 AI 代理的攻擊技術,包括 DOM 注入、導覽劫持、憑證竊取,以及針對瀏覽器控制代理的跨來源利用。
程式碼代理操縱
操縱生成、執行與審查程式碼的 AI 代理的技術,包括透過程式碼上下文進行注入、儲存庫投毒、執行環境攻擊,以及程式碼審查操縱。
Computer Use 代理 攻擊s
Comprehensive analysis of attack vectors targeting AI systems with computer use capabilities, including GUI manipulation, pixel-level injection, and desktop environment exploitation techniques.
Email 代理 利用ation
Techniques for exploiting AI agents that process, summarize, draft, and act on emails, including injection through email content, attachment-based attacks, and workflow manipulation.
File System 代理 Risks
安全 risks of AI agents with file system access, including path traversal exploitation, symlink attacks, file content injection, data exfiltration through file operations, and privilege escalation via file system manipulation.
AI 代理利用
經混淆代理攻擊、目標劫持、特權升級與沙箱逃逸利用 AI 代理架構之方法論。
代理記憶投毒
投毒 AI 代理短期與長期記憶系統的技術,以達成持久入侵、注入行為後門,並於會話重置後存活。
排程代理攻擊
針對管理行事曆、安排會議與協調行程之 AI 排程助理的攻擊技術,含行事曆注入、可用時段操弄,以及基於排程的社交工程。
語音代理攻擊
針對語音控制 AI 代理之攻擊技術,包含對抗性音訊注入、超音波命令、用以繞過認證之語音複製,以及語音優先 AI 系統中的對話劫持。
函式呼叫攻擊(Function Calling Exploitation)
概述 LLM 函式/工具呼叫的運作方式、其產生的攻擊面,以及對 AI 系統中函式呼叫介面進行利用的系統化方法。
代理式利用
代理式 AI 系統中安全漏洞的完整涵蓋,包含 MCP 工具利用、多代理協議攻擊、函式呼叫濫用、記憶體系統入侵、框架特定弱點與工作流程模式攻擊。
AWS Bedrock 代理安全評估
針對 AWS Bedrock 代理的安全評估,涵蓋 action groups、知識庫與護欄配置。
AWS Bedrock 代理安全
AWS Bedrock 代理的安全評估,涵蓋 action groups、知識庫與護欄整合。
GCP Vertex AI Agent Builder 安全
Google Vertex AI Agent Builder 的安全評估,包括 grounding、工具使用與安全設定。
2026 年夏季 CTF:代理 AI 安全
以代理 AI 安全為焦點之 CTF,具涵蓋工具利用、多代理攻擊、間接注入與代理持久性之升級代理挑戰。
代理架構與工具使用模式
ReAct、Plan-and-Execute 與 LangGraph 代理模式如何運作——工具定義、呼叫與結果處理——以及注入於每個架構中發生之處。
世界模型利用
利用已學世界模型進行對抗性目的的利用與相應防禦。
實作:Computer Use 代理攻擊
探索針對以 GUI 為本之 computer use 代理(透過視覺與動作原語與畫面互動)之攻擊向量的實作課程。
實驗室: Exploiting AI 代理
動手實驗室,主題為exploiting AI agents with tool access through indirect 提示詞注入,tool-call chaining,privilege escalation techniques.
實驗室: 代理 記憶 操控
動手實驗室,主題為injecting persistent instructions into an agent's memory與context that affect future interactions與conversations.
實驗室: 代理 提示詞 Leaking
動手實驗室,主題為extracting system prompts from tool-using AI agents by exploiting tool interactions,observation channels,multi-step reasoning to leak protected instructions.
實驗室: Data Exfiltration Techniques
動手實驗室,主題為extracting sensitive data from AI systems,包括 系統提示詞 extraction,context leakage via markdown rendering,URL-based 資料外洩.
實驗室: Function Calling 注入
動手實驗室,主題為exploiting function calling mechanisms by crafting inputs that manipulate which functions get called與with what parameters.
實驗室: MCP 工具 Abuse Scenarios
動手實驗室,主題為exploiting 模型 上下文 Protocol tool definitions through malicious tool descriptions,tool confusion attacks,server impersonation.
實驗室: 代理 Permission 提升
動手實驗室,主題為tricking AI agents into performing actions beyond their intended scope through privilege escalation techniques.
實驗室: 工具 Result 投毒
動手實驗室,主題為poisoning tool outputs,以重新導向 agent behavior by injecting malicious content through tool results.
實驗室: Workflow Hijacking
動手實驗室,主題為redirecting multi-step agent workflows to perform unintended actions by manipulating intermediate states與control flow.
透過注入的沙箱逃逸
使用提示詞注入作為逃逸應用沙箱並達成未授權程式碼執行或系統存取的向量。
Agent Privilege Escalation 詳解
Walkthrough of escalating privileges in multi-agent systems through trust chain exploitation.
AWS Bedrock 紅隊 導覽
Complete guide to red teaming AWS Bedrock deployments: testing guardrails bypass techniques, knowledge base data exfiltration, agent prompt injection, model customization abuse, and CloudTrail evasion.
CrewAI 代理 Application 安全 Testing
End-to-end walkthrough for security testing CrewAI agent applications: crew enumeration, agent role exploitation, task injection, tool security assessment, delegation chain manipulation, and output validation.
LangChain Application 安全 Testing
End-to-end walkthrough for security testing LangChain applications: chain enumeration, prompt injection through chains, tool and agent exploitation, retrieval augmented generation attacks, and memory manipulation.
LlamaIndex RAG Application 安全 Testing
End-to-end walkthrough for security testing LlamaIndex RAG applications: index enumeration, query engine exploitation, data connector assessment, response synthesis manipulation, and agent pipeline testing.