# embeddings
標記為「embeddings」的 21 篇文章
嵌入與向量安全評量
以 10 道題目測試你對嵌入反演攻擊、向量資料庫安全、相似度搜尋操縱與已儲存嵌入隱私風險的理解。
RAG 與資料攻擊評量
以 10 道中級題目測試你對檢索增強生成攻擊向量、知識庫投毒、嵌入操縱與透過 RAG 系統進行資料外滲的知識。
對嵌入的隱私攻擊
從嵌入表徵中擷取敏感資訊與訓練資料。
RAG 流程利用
攻擊檢索增強生成流程的方法論:知識投毒、分塊邊界操弄、檢索分數操控、跨租戶資料外洩、GraphRAG 攻擊與中繼資料注入。
Knowledge Base 投毒
Techniques for injecting adversarial documents into RAG knowledge bases: ingestion path analysis, embedding space attacks, SEO-style ranking manipulation, staged poisoning, and effectiveness measurement.
基於語義相似度的防禦
利用嵌入相似度分析偵測語義上接近已知攻擊模式的對抗性輸入。
基於語義相似度的防禦(防禦緩解)
運用語義相似度,將使用者輸入與已知攻擊模式比對以偵測提示詞注入。
嵌入模型安全比較
跨嵌入模型的安全屬性比較——涵蓋 OpenAI、Cohere、Voyage、開源模型的反演抵抗力、隱私屬性與對抗性穩健性。
嵌入與向量安全
嵌入如何在 AI 系統中建立隱藏的攻擊面:向量資料庫安全邊界、嵌入層級攻擊與 RAG 檢索操控。
給紅隊員的嵌入向量與向量空間
理解嵌入向量如何編碼語意意義、向量運算如何運作,以及為何紅隊員需要理解嵌入空間以進行 RAG 攻擊與相似性利用。
實作:探索嵌入空間
使用 Python 視覺化嵌入空間、測量語意相似度,並展示如何打造與目標查詢匹配的對抗性文件之動手實作。
基礎
AI 紅隊演練的核心建構區塊,涵蓋紅隊方法論、AI 景觀、大型語言模型如何運作、嵌入向量與向量系統、AI 系統架構,以及對抗性機器學習概念。
Embedding 空間利用
利用 embedding 幾何、執行反轉攻擊、打造對抗擾動,以及經由最近鄰操弄投毒 RAG 系統之技術。
大型語言模型內部結構
為利用開發深入探索大型語言模型內部機制的技術,涵蓋激活分析、對齊繞過原語與嵌入空間利用。
Lab: Embedding Fundamentals for Red Teamers
學習 embedding fundamentals including vector similarity, semantic search, and how 嵌入 enable RAG systems.
實作:嵌入空間操控
動手實作,示範如何透過嵌入碰撞攻擊,使用 sentence-transformers 來精心製作可被特定查詢檢索出的文件。
嵌入 Similarity Attacks
Manipulate text to achieve target embedding similarity scores for retrieval poisoning.
Semantic Search 投毒
Craft adversarial documents that rank highly in semantic search for targeted queries in RAG systems.
模擬:RAG 管線投毒
針對以 RAG 為本之知識管理系統之紅隊委任模擬,涵蓋 embedding 注入、文件投毒、檢索操弄與知識庫外洩。
嵌入空間攻擊
攻擊 LLM 嵌入層的技術,包括對抗性擾動、嵌入反演與語意空間操縱。
Semantic Similarity Detection
Step-by-step walkthrough for using text embeddings to detect semantically similar prompt injection attempts, covering embedding model selection, vector database setup, similarity threshold tuning, and production deployment.