# poisoning
標記為「poisoning」的 63 篇文章
代理供應鏈攻擊
透過被投毒的套件、被植入後門的 MCP 伺服器、惡意模型註冊表與武器化的代理框架攻陷 AI 代理——包含 Postmark MCP 入侵事件與 NullBulge 攻擊行動。
對話記憶體投毒
投毒對話歷史儲存,以改變代理對先前互動的理解。
記憶體檢索投毒
針對檢索管線(嵌入比對、排名、過濾)的攻擊,使惡意記憶被傳回並送入代理上下文。
Vector-based 記憶體投毒
對代理系統中之 vector-based 記憶體儲存投毒,於檢索時注入偽造脈絡。
共享記憶體空間投毒
於多租戶代理部署中投毒多代理或多使用者共享之記憶體空間。
函式呼叫上下文注入
藉由函式呼叫上下文(參數、系統訊息、工具結果)注入對抗性指令的技術。
函式結果投毒
將惡意內容注入函式回傳值,以引導代理後續推理與行動的攻擊。
MCP schema 投毒
投毒 MCP 工具與資源 schema,使代理以對抗者偏好的方式選擇與參數化工具。
MCP 工具 Schema 投毒
於描述、參數型別與驗證規則中以隱藏指令對 MCP 工具 schema 進行投毒。
A2A 成品投毒
向 A2A 成品注入對抗性指令或資料,使讀取成品的代理執行攻擊者行為。
代理群集投毒
投毒代理群集的共享記憶體、知識庫或通訊通道,以傳染影響整個群集的對抗性指令。
向量資料庫鑑識
偵測與調查向量資料庫投毒、未授權修改與資料完整性違規的鑑識分析技術。
技能驗證: 代理記憶攻擊
Practical verification of 記憶投毒、context manipulation、cross-session persistence skills。
案例研究:生產環境中的 RAG 投毒事件
詳細分析真實世界的 RAG 投毒事件,包含攻擊方法論、影響與補救。
程式碼庫上下文投毒
投毒 AI 程式助理所讀取的程式碼庫上下文,以操控生成建議。
2026 年 5 月:RAG 投毒挑戰
將惡意文件注入檢索增強生成系統以控制特定查詢的回應,同時不干擾正常運作。
乾淨標籤投毒攻擊
進階的乾淨標籤攻擊,在維持正確標籤的同時嵌入對抗性特徵以規避偵測。
資料去重攻擊
利用資料去重處理,繞過過濾並引入惡意訓練資料。
資料投毒策略
大規模影響模型行為的訓練資料投毒綜合策略。
聯邦學習投毒
針對聯邦學習系統的精密投毒技術,含拜占庭抗性手法。
基於梯度的資料投毒
進階的基於梯度的投毒樣本設計技術,使其對模型行為影響最大化。
Knowledge Base 投毒
Techniques for injecting adversarial documents into RAG knowledge bases: ingestion path analysis, embedding space attacks, SEO-style ranking manipulation, staged poisoning, and effectiveness measurement.
合成資料投毒(實務)
合成資料投毒攻擊的實作演練,附詳細程式範例。
大規模網路爬蟲投毒
大規模執行網路爬蟲投毒,以影響未來的模型訓練資料集。
網路規模資料投毒
針對現代機器學習管線所用網路爬取資料集的大規模投毒攻擊。
嵌入投毒技術
透過對訓練資料或嵌入空間投毒,扭曲向量表徵的技術。
RAG 檢索投毒
對 RAG 系統使用的知識庫進行投毒,影響檢索結果並引導下游生成輸出。
適配器投毒攻擊
對公開共享的適配器與 LoRA 權重進行投毒,以危害下游使用者。
安全資料集投毒
透過對安全評估資料集與安全導向微調資料投毒攻擊安全訓練管線,破壞安全訓練。
對抗式 ML:核心概念
對抗式機器學習的歷史與基本原理——擾動攻擊、逃避與投毒、穩健性——將古典對抗式 ML 銜接至 LLM 特有攻擊。
程式碼建議投毒(前沿研究)
投毒訓練資料與套件生態系以影響 AI 程式碼建議:不安全模式播種、套件名稱混淆、木馬程式碼注入,與供應鏈風險。
聯邦學習模型投毒
針對聯邦學習系統的模型投毒攻擊及其相應防禦。
合成資料投毒
針對合成資料生成管線的投毒攻擊,以及對下游模型的影響。
模型註冊表投毒
針對模型註冊表的投毒攻擊,包含 Typo-squatting、依賴混淆與供應鏈劫持。
Lab: Training Curriculum Poisoning
Exploit training data ordering and curriculum learning to amplify the impact of small numbers of poisoned examples.
Lab: Federated Learning Poisoning Attacks
Execute model 投毒 attacks in a federated learning simulation by manipulating local model updates.
Lab: Federated Learning Poisoning Attack
動手實作 for understanding and simulating 投毒 attacks against federated learning systems, where a malicious participant corrupts the shared model through crafted 梯度 updates.
Gradient-Guided Data 投毒
Use gradient information from open-source models to craft optimally poisoned training examples.
Advanced RAG Poisoning Techniques
Execute sophisticated RAG 投毒 including 梯度-guided document crafting.
CTF:供應鏈攻擊
尋找並利用 ML 供應鏈漏洞,包括遭入侵相依、被投毒模型、被植後門訓練資料與惡意模型檔。練習 ML 特有的供應鏈安全評估。
實作:ML 流水線投毒
Compromise an end-to-end machine learning pipeline by attacking data ingestion, preprocessing, training, evaluation, and deployment stages. 學習 to identify and exploit weaknesses across the full ML lifecycle.
Federated Learning 投毒 攻擊
執行模型投毒 attacks in a federated learning setting through adversarial participant manipulation.
實驗室: 進階 RAG 投毒
動手實驗室,主題為crafting documents that reliably get retrieved與influence RAG responses for specific target queries.
上下文 Window 投毒 實驗室
利用 context window management to inject persistent adversarial content that influences future model responses.
實驗室: 代理 記憶 投毒
動手lab exploring how conversational memory in AI agents can be poisoned to alter future behavior,inject persistent instructions,exfiltrate data across sessions.
RAG 上下文 投毒
Poison a 向量資料庫 to inject adversarial content into RAG retrieval results.
實驗室: RAG 流水線 投毒
動手實驗室,主題為setting up a RAG pipeline with LlamaIndex,injecting malicious documents,testing retrieval poisoning,measuring injection success rates.
Semantic Search 投毒
Craft adversarial documents that rank highly in semantic search for targeted queries in RAG systems.
模擬:RAG 管線投毒
針對以 RAG 為本之知識管理系統之紅隊委任模擬,涵蓋 embedding 注入、文件投毒、檢索操弄與知識庫外洩。
模型遙測投毒
操弄模型遙測與可觀測性資料以隱匿攻擊、製造誤報或削弱監控有效性。
多模態 RAG 投毒
透過影像、文件與其他模態對多模態 RAG 系統進行投毒攻擊。
RAG 管線投毒
透過投毒檢索增強生成管線以操控 AI 回應的技術——涵蓋文件注入、嵌入操控、檢索排名攻擊與持久投毒策略。
基於梯度的資料投毒(訓練管道)
以梯度資訊打造最佳化對抗訓練樣本,針對性地操弄模型。
偏好資料投毒(訓練管道)
投毒 RLHF 與 DPO 使用的偏好資料,將模型對齊推向攻擊者目標。
合成資料投毒向量
針對模型訓練與資料增強所用合成資料產生管道的攻擊向量。
分詞器投毒攻擊
攻擊分詞器訓練與詞彙表,製造可繞過安全措施的對抗 token 樣式。
訓練資料策劃攻擊
攻擊資料策劃管道,大規模將對抗樣本植入訓練資料集。
LLM 快取投毒詳解
Poison LLM response caches to serve adversarial content to other users without direct injection.
Few-Shot Example Poisoning 詳解
Poison few-shot examples in prompts to establish behavioral patterns that override system instructions.
Function Schema Poisoning 詳解
Poison function schemas to inject hidden instructions that redirect model tool selection and parameter filling.
RAG Poisoning End-to-End 詳解
Complete walkthrough of poisoning a RAG system from document injection through information extraction.
Model Supply Chain Poisoning
Walkthrough of poisoning ML supply chains through dependency confusion, model weight manipulation, and hub attacks.
RAG Hybrid Search Poisoning 詳解
Walkthrough of poisoning both vector and keyword search in hybrid RAG architectures for maximum retrieval influence.