# provenance
標記為「provenance」的 17 篇文章
LLM 輸出浮水印偵測
偵測、萃取與分析嵌入於 LLM 生成文字中浮水印的技術,用於來源追蹤與鑑識歸因。
Capstone:供應鏈安全工具
Capstone 專案:打造 AI/ML 供應鏈安全工具,驗證模型權重、資料集與依賴的完整性與來源。
2026 年 7 月:供應鏈稽核挑戰
稽核某 ML 專案的完整供應鏈安全問題,涵蓋依賴、模型來源、資料管線、訓練基礎設施與部署工件。
資料來源攻擊
針對資料來源追蹤與驗證系統的攻擊,含供應鏈操縱。
浮水印與指紋規避
深入探討偵測與移除輸出浮水印、退化權重浮水印、規避模型指紋辨識、建立出處剝離管線,以及理解模型所有權驗證的法律格局。
AI 浮水印與攻擊
當前針對模型輸出與訓練資料的 AI 浮水印方案、其安全屬性,以及已知可移除、偽造或規避浮水印的攻擊。
輸出來源追蹤
追蹤 LLM 輸出來源的系統,用以偵測幻覺、資料外洩與指令注入。
為來源追蹤而對 LLM 輸出加浮水印
以進階技術為 LLM 生成文字加浮水印以建立來源記錄,涵蓋部署架構、多位元編碼方案、穩健性考量,以及浮水印在 AI 安全與問責框架中的角色。
輸出浮水印作為防禦
於 LLM 應用中利用輸出浮水印進行內容來源追蹤與濫用偵測。
模型簽章與驗證
模型簽章與驗證機制,包含 Sigstore、模型雜湊與部署時驗證。
訓練資料完整性
訓練資料完整性的保護,包含資料血緣、驗證、投毒偵測與簽章。
ML Artifact Integrity
Ensuring integrity of ML artifacts throughout the pipeline: hash verification strategies, signed artifact workflows, reproducible builds for ML, deterministic training challenges, and end-to-end artifact provenance.
模型 Signing and Provenance
Cryptographic signing for ML models: Sigstore for ML artifacts, cosign for model weights, SLSA framework applied to ML pipelines, supply chain levels for model provenance, and practical implementation of model artifact verification.
合成資料管線攻擊
對合成資料生成管線之攻擊:來自合成回饋迴圈之模型崩塌、投毒合成資料產生器、品質控制繞過,以及資料來源攻擊。
浮水印移除技術
移除 AI 浮水印的技術:換句話攻擊、token 替換、embedding 空間擾動,及其對模型來源與可究責性的意涵。
訓練資料來源攻擊
攻擊訓練資料來源與歸因系統,植入未驗證的資料來源。
Hugging Face 安全 Audit 導覽
Step-by-step walkthrough for auditing Hugging Face models: scanning for malicious model files, verifying model provenance, assessing model card completeness, and testing Spaces and Inference API security.