# privacy
標記為「privacy」的 43 篇文章
記憶體外洩
透過代理記憶體系統外洩敏感資料的技術,包括查詢操縱、輸出通道與橫向讀取。
AI 資料外洩調查
調查涉及 AI 系統的資料外洩,包括訓練資料暴露、模型記憶利用與嵌入反演攻擊。
資料隱私 in AI 評估
評估涵蓋training 資料隱私、membership inference、data extraction、privacy-preserving技巧。
嵌入與向量安全評量
以 10 道題目測試你對嵌入反演攻擊、向量資料庫安全、相似度搜尋操縱與已儲存嵌入隱私風險的理解。
隱私攻擊評量
以 9 道題目測試你對 AI 系統隱私攻擊的進階知識,包括資料洩漏、PII 萃取、差分隱私失敗與推論時隱私風險。
案例研究:Samsung ChatGPT 資料外洩
分析 Samsung 機密程式碼透過 ChatGPT 外洩的事件,以及對組織 AI 政策的啟示。
案例研究:從 GPT 萃取訓練資料
分析 Carlini 等人從生產環境 ChatGPT 萃取訓練資料的研究。
臉部辨識偏見與失誤
分析臉部辨識 AI 事件,包括商用系統中的種族與性別偏見、誤捕、隱私侵犯,以及對生物辨識 AI 進行對抗性攻擊的安全意涵。
ChatGPT 資料外洩(2023 年 3 月)
分析 2023 年 3 月 ChatGPT 事件,Redis 客戶端函式庫的錯誤導致使用者看見其他使用者的對話標題、部分聊天紀錄與支付資訊。涵蓋根本原因、衝擊與 AI 應用安全的教訓。
資料集推論攻擊
透過分析模型行為推論訓練資料集的屬性。
資料與訓練安全
AI 資料管線中的安全漏洞,涵蓋 RAG 利用、訓練資料攻擊、模型萃取與智慧財產盜竊,以及對已部署模型的隱私攻擊。
成員推論防禦
針對成員推論攻擊的進階防禦技術,含差分隱私。
成員推論:實務攻擊
實務實作成員推論攻擊以判定訓練資料的成員關係。
模型反演攻擊
從模型梯度與預測中還原機器學習各情境下的私有訓練資料。
模型記憶化模式
理解並利用模型對特定訓練樣本的記憶化模式。
隱私與資料保護攻擊
對 AI 系統之隱私攻擊概觀,含資料提取、成員推論與模型反轉,配法規意涵與紅隊方法論。
成員推論攻擊
判定特定資料是否被用來訓練 AI 模型的技術,包括陰影模型途徑、基於損失的推論、LiRA 與實務實作指引。
進階模型反演攻擊
使用基於梯度的反演、生成式模型輔助重建,以及成員推論精煉,從模型權重與 API 存取重建訓練資料。
模型反演攻擊(資料訓練)
從模型輸出重建訓練資料的技術,包括基於梯度的反演、生成式模型反演,以及對影像與語言模型的隱私意涵。
PII 萃取技術
從訓練過的語言模型中萃取個人可辨識資訊的技術,包含基於提示詞的萃取、前綴攻擊、針對性查詢與真實案例。
對嵌入的隱私攻擊
從嵌入表徵中擷取敏感資訊與訓練資料。
合成資料安全風險
合成資料生成的安全風險,含隱私外洩與分布攻擊。
AI 日誌架構
AI 系統日誌應擷取什麼——提示詞、補全、延遲、符元、工具呼叫——以及儲存策略、保留政策與隱私考量。
嵌入向量層級攻擊
直接鎖定嵌入向量的攻擊概覽:對抗性嵌入產生、用於文字重建的反演攻擊,以及透過嵌入分析的成員推論。
嵌入反演攻擊
由嵌入向量重建輸入文字的技術:模型特定反演方法、隱私意涵,以及對抗嵌入反演的防禦。
透過嵌入進行成員推論
透過距離式推論、統計檢定與嵌入行為分析,判定特定資料是否存在於嵌入模型的訓練集之中。
嵌入反演攻擊
從嵌入向量反演出原始文字或 PII 的攻擊。
經由向量資料庫的資料外洩
向量資料庫的資料外洩技術:以嵌入反演重建文件、列舉攻擊、以相似度為基礎的資料採集。
遺忘攻擊與防禦
針對機器遺忘方法的攻擊與防禦,包括重新學習與萃取攻擊。
機器遺忘安全研究
針對機器遺忘方法的攻擊研究與知識移除驗證。
AI 資料治理與安全
Data governance practices specific to AI systems including training data provenance, access controls, and retention.
聯邦學習安全
聯邦學習的安全威脅,包含拜占庭節點、梯度洩漏、後門注入與隱私攻擊。
GPU 記憶體側通道
GPU 記憶體側通道攻擊,包含 L2 快取時序、記憶體殘留與跨租戶洩漏。
Lab: Training Data Extraction at Scale
Extract memorized training data from 語言模型 using prefix-based extraction, divergence testing, and membership inference. Measure extraction rates and assess privacy risks.
嵌入 Inversion 攻擊 實作
實作embedding inversion to recover original text from 向量資料庫 embeddings.
模擬:語音助理紅隊
針對部署於智慧家庭平台之 AI 語音助理之紅隊委任模擬,涵蓋音訊型提示注入、喚醒詞利用,以及隱私外洩。
透過注入進行資料收割
使用注入技術從大型語言模型應用程式中萃取訓練資料、系統提示詞、使用者資料與其他敏感資訊。
擷取訓練資料
透過針對性查詢與成員推論攻擊,從 LLM 中擷取已記憶之訓練資料、系統提示與私密資訊的技術。
嵌入反演
從嵌入向量還原原始文字、儲存嵌入所帶來的隱私影響、對向量資料庫的模型反演攻擊,以及嵌入空間分析技術。
聯邦學習投毒(訓練管線)
聯邦學習架構漏洞:Byzantine 攻擊、模型替換、梯度操弄,以及經由惡意參與者投毒全域模型之技術。
機器遺忘(Unlearning)攻擊
利用機器遺忘流程:回復理論上已被遺忘的資料、遺忘驗證攻擊、部分遺忘利用,以及神經網路中遺忘的根本限制。
訓練資料歸因安全
訓練資料歸因方法的安全意涵,以及攻擊者如何利用歸因系統規避偵測。
PII Redaction Pipeline
Step-by-step walkthrough for building an automated PII detection and redaction pipeline for LLM outputs, covering regex-based detection, NER-based detection, presidio integration, redaction strategies, and compliance testing.