# injection
標記為「injection」的 95 篇文章
記憶體 schema 注入
透過記憶體 schema 中的欄位、類型或約束注入對抗內容,使代理錯誤解讀所讀入的結構化記憶。
持久記憶注入
將持久的偽造記憶注入代理記憶系統,以影響未來行為。
記憶體壓縮注入
透過長時執行代理之記憶體壓縮與摘要流程注入持久指令。
函式 schema 注入
透過修改、擴充或注入函式 schema 欄位以誤導代理選擇與參數化函式的攻擊。
參數操弄
打造 LLM 函式呼叫中惡意參數值的技術,包含型別混淆、邊界越界、經由參數之注入,以及利用不完善之驗證。
結構化輸出工具注入
利用結構化輸出模式,將工具呼叫指令注入模型回應。
MCP 設定注入
透過操縱 MCP 用戶端或伺服器設定注入惡意連線、工具路徑與預設參數的攻擊。
MCP 提示詞模板注入
透過 MCP 提示詞模板與變數注入對抗性指令,使模板生成的提示詞挾帶攻擊者載荷。
MCP 工具描述注入
將對抗性指令注入 MCP 工具描述欄位,利用代理將工具描述視為系統級可信上下文的特性。
MCP 資源模板注入
透過 MCP 資源 URI 模板與參數擴展機制注入對抗內容。
針對注入偵測的日誌分析
在 AI 互動日誌中偵測提示詞注入與相關攻擊的技術,含模式比對、異常偵測與行為剖析。
Injection Defense 評估
評估涵蓋defending against 提示詞注入包括 classifiers、guardrails、output filtering。
案例研究:真實世界中的提示詞注入
蒐集生產應用中被記錄的提示詞注入事件。
Commit 訊息注入
透過 commit 訊息注入,用以引導 AI 程式助理朝特定方向行動。
GitHub Copilot 注入攻擊
針對 GitHub Copilot 與相似程式助理的注入攻擊。
以文件為基礎的程式碼注入
將對抗指令嵌入程式碼註解、docstring 與文件檔案,以影響 AI 程式碼生成。
IDE 外掛注入攻擊
針對 IDE 內 AI 外掛的注入攻擊,可造成程式碼外洩或任意指令執行。
2026 年 5 月:RAG 投毒挑戰
將惡意文件注入檢索增強生成系統以控制特定查詢的回應,同時不干擾正常運作。
月度挑戰:注入奧運
每月社群挑戰,聚焦於跨多模型的創意提示詞注入技術。
提示詞注入金絲雀系統
在系統提示詞中部署金絲雀字串,以偵測並警示提示詞注入與萃取嘗試。
向量資料庫注入攻擊
透過中繼資料過濾器、查詢參數或管理介面,對向量資料庫進行注入攻擊。
向量資料庫注入
透過中繼資料、過濾器與管理介面對向量資料庫進行注入攻擊。
螢幕擷取注入
透過電腦使用 AI 代理使用的螢幕擷取管線注入惡意內容的技術,包括影格操控、擷取時序攻擊,以及透過視覺通道進行像素層面載荷傳遞。
機器人控制注入
將惡意指令注入 LLM 控制之機器人系統之技術:經任務描述之提示注入、程式碼生成利用、參數操弄與動作序列劫持。
輸出處理漏洞
LLM 輸出處理的安全漏洞,包含不安全輸出處理、命令注入與 XSS。
跨架構注入轉移
研究注入技術如何跨越模型架構轉移,以及哪些架構特性決定轉移性。
跨語言注入轉移研究
研究注入技術如何在不同語言與多語言模型之間轉移。
感知防禦的載荷設計
透過探測與回饋式最佳化,設計能適應並規避特定防禦機制的注入載荷。
由防禦機制推導的注入設計
一種將已知防禦機制納入考量的注入設計方法論。
注入研究
提示詞注入、越獄自動化與多模態攻擊向量的進階研究,涵蓋超越標準注入方法的尖端技術。
推理模型中的注入
針對推理增強模型的注入攻擊研究,利用其思維鏈 (chain-of-thought) 與自我反思機制。
注入攻擊面分類法
LLM 應用中所有已知注入攻擊面的完整分類法。
多代理注入研究
研究注入如何在多代理系統中傳播,以及哪些性質決定感染擴散速率。
新型注入類別
探討不符合傳統分類法的新興注入類別,包括結構性、時序性與跨系統注入向量。
語意注入研究
研究在語意上連貫、難以與正常輸入區分的注入。
語意空間注入研究
研究在語意嵌入空間而非符元空間中運作的注入 — 直接利用已學到的表徵。
注入成功率的時序動態
研究注入成功率如何隨模型更新與防禦演進而變化。
Multimodal Image Injection
Embed 對抗性 text in images that triggers 提示詞注入 in vision-語言模型.
Audio 注入 via Speech-to-Text 模型
Craft adversarial audio that embeds 提示詞注入 payloads when transcribed by speech-to-text models.
代理 記憶 注入 for Persistent Access
注入persistent instructions into agent memory systems that survive across conversation sessions.
Few-Shot Injection Fundamentals
Craft few-shot examples that prime the model to follow attacker instructions in subsequent turns.
Hello World 提示詞 注入
Write與test your first 提示詞注入 payload 對抗 a simple chatbot to underst與the fundamental attack mechanism.
Emoji and Unicode 注入 Techniques
Use emoji sequences與Unicode special characters to bypass text-based input filters.
JSON 注入 Basics
注入adversarial content through JSON-formatted inputs to exploit structured data processing.
提示詞 注入 via File Names
Embed 提示詞注入 payloads in filenames與metadata of uploaded documents.
提示詞 注入 via Translation
利用 LLM translation capabilities to smuggle instructions through language boundaries.
XML 注入 in LLM Contexts
利用 XML tag handling in LLM applications to manipulate instruction parsing.
Cross-上下文 注入
注入prompts that persist across separate conversation contexts in shared deployments.
Document-Based RAG 注入 實驗室
注入adversarial content into documents that will be processed by a RAG system to influence model responses.
實驗室: Few-Shot Example 注入
動手lab exploring how injected few-shot examples can steer language model outputs toward attacker-chosen behaviors by exploiting in-context learning.
實驗室: Function Calling 注入
動手實驗室,主題為exploiting function calling mechanisms by crafting inputs that manipulate which functions get called與with what parameters.
實驗室: Image-Based 提示詞 注入
動手lab exploring how text instructions embedded in images can be used to perform 提示詞注入 對抗 vision-language models (VLMs) that process visual input.
實驗室: JSON Input 注入
動手lab exploring how adversarial payloads injected through structured JSON inputs can manipulate language model behavior,bypass schema validation,exploit parsing inconsistencies.
實驗室: Markdown-Based 注入
動手lab exploring how Markdown rendering in AI-generated outputs can be exploited to inject hidden content,exfiltrate data through image tags,manipulate displayed information.
實驗室: RAG Metadata 注入
動手實驗室,主題為exploiting metadata fields like titles,descriptions,timestamps to manipulate RAG retrieval ranking與influence responses.
Multi-Language 注入 Attacks
利用 language switching與low-resource language gaps to bypass safety training.
Semantic 注入 Crafting
Craft semantically coherent injections that evade both classifiers與human review.
實驗:工具結果注入攻擊
透過工具呼叫結果注入對抗性內容,毒化模型推理並重新導向後續動作。
Assistant Prefill 注入 Attacks
利用 assistant message prefilling to prime model responses與bypass safety alignment.
PDF Document 注入 for RAG Systems
Craft adversarial PDF documents that inject instructions when processed by RAG document loaders.
工具 Result 注入 Attacks
Craft malicious tool return values that inject instructions back into the model's reasoning chain.
音訊注入攻擊
透過音訊管道注入惡意指令或對抗性內容,操弄多模態 AI 模型行為。
文件解析攻擊
帶有隱藏指令的惡意 PDF、DOCX 及其他文件,專門用於利用 AI 文件處理器:不可見文字注入、元資料投毒,以及渲染差異。
模態橋接注入攻擊
於非文字模態編碼提示注入 payload 以繞過聚焦於文字之安全過濾器的技術,包括視覺注入、音訊注入與跨模態編碼策略。
文件中繼資料注入
利用文件中繼資料欄位夾帶對抗性指令或內容,影響下游 AI 處理流程。
影像注入技術
在影像中嵌入隱形或半隱形指令,使視覺語言模型誤將其視為合法提示詞。
針對 AI 攻擊的影像隱寫術
使用隱寫術技術將對抗性載荷嵌入圖像中,規避人工檢查和自動化偵測,同時影響 AI 模型行為。
影像隱寫注入
利用隱寫技術將指令或資料嵌入影像,以規避視覺檢查並操弄多模態模型。
截圖注入攻擊
將對抗性內容嵌入截圖,讓視覺 AI 代理將其誤認為合法的使用者介面元素。
隱寫注入
運用隱寫術將對抗性指令藏入看似無害的媒體中,進行多模態注入攻擊。
排版注入攻擊
透過字型選擇、字距與排版操弄,對視覺 AI 系統進行注入攻擊。
影片影格注入
將對抗性影格插入影片串流,以操弄處理影片內容的 AI 系統。
認知負荷注入
透過壓垮安全推理的認知負荷攻擊利用模型容量。
指令階層利用
利用不同模型供應商間指令優先階層的模糊性。
分塊邊界攻擊
利用 RAG 流程中的文件切分與分塊機制,包含分塊邊界處的載荷注入、跨分塊指令注入與分塊大小操縱。
元資料注入
操縱文件元資料以影響 RAG 檢索排名、繞過過濾、偽造來源歸屬,並利用基於元資料的存取控制。
RAG 管線投毒
透過投毒檢索增強生成管線以操控 AI 回應的技術——涵蓋文件注入、嵌入操控、檢索排名攻擊與持久投毒策略。
注入載荷速查表
經驗證注入載荷的快速參考,依技術類別、編碼方式與目標防禦類型組織。
A2A 協定注入演練
利用 Google 的 Agent-to-Agent 協定進行跨代理提示詞注入的詳解。
批次處理注入詳解
Inject payloads through batch processing pipelines where individual items are processed without isolation.
Computer Use Agent Injection 詳解
Walkthrough of injecting prompts through UI elements and screenshots processed by computer-use agents.
Document-Based Injection 詳解
Inject prompts through documents processed by LLM applications including PDFs, spreadsheets, and presentations.
JSON Injection 攻擊 詳解
Exploit JSON parsing and generation in LLM applications to inject payloads through structured data boundaries.
Advanced Markdown Injection 詳解
Inject Markdown that triggers data exfiltration through image rendering, link generation, and code block escape.
記憶體 投毒 Step by Step
導覽 of persisting injection payloads in agent memory systems to achieve long-term compromise of LLM-based agents.
Model Context Window Overflow 詳解
Overflow the context window to push safety instructions outside the effective attention range.
多模態圖像注入詳解
Step-by-step walkthrough of embedding adversarial prompts in images for vision model exploitation.
Supply Chain Prompt Injection 詳解
Plant injection payloads in upstream data sources consumed by LLM applications including packages and documentation.
Synthetic Identity Injection 詳解
Create synthetic identities that exploit LLM trust mechanisms to achieve elevated instruction priority.
工具 Call Injection
Step-by-step walkthrough of injecting malicious parameters into LLM tool and function calls to execute unauthorized actions in agent systems.
Knowledge Graph Injection 攻擊 詳解
Walkthrough of injecting adversarial facts into knowledge graphs consumed by LLM-based reasoning systems.
Recursive Prompt Injection 詳解
Walkthrough of creating self-replicating injection payloads that persist through model output-to-input loops.
Voice AI Prompt Injection 詳解
Walkthrough of injecting prompts into voice-based AI assistants through adversarial audio and ultrasonic signals.
XML Injection in LLM Systems 詳解
Exploit XML parsing in LLM application pipelines to inject instructions through entity expansion and CDATA sections.
XML and JSON Injection in LLM Apps
Walkthrough of exploiting XML and JSON parsing in LLM applications for injection and data manipulation.