# watermarking
標記為「watermarking」的 12 篇文章
LLM 輸出浮水印偵測
偵測、萃取與分析嵌入於 LLM 生成文字中浮水印的技術,用於來源追蹤與鑑識歸因。
ai-forensics-irwatermarkingllm-outputprovenance
模型萃取與智慧財產竊盜
針對已部署 AI 系統的黑盒模型萃取、API 蒸餾、旁路攻擊、浮水印移除與模型指紋繞過方法論。
model-extractiondistillationside-channelwatermarkingfingerprintingip-theftapi-attacks
浮水印與指紋規避
深入探討偵測與移除輸出浮水印、退化權重浮水印、規避模型指紋辨識、建立出處剝離管線,以及理解模型所有權驗證的法律格局。
watermarkingfingerprintingevasionprovenanceip-theftmodel-extraction
AI 浮水印與攻擊
當前針對模型輸出與訓練資料的 AI 浮水印方案、其安全屬性,以及已知可移除、偽造或規避浮水印的攻擊。
watermarkingprovenancedetectionattackstext-watermark
浮水印與 AI 生成文字偵測
LLM 輸出的統計浮水印方案、AI 生成文字偵測器、其密碼學基礎,以及規避或移除浮水印的系統化技術。
watermarkingdetectionai-generated
為來源追蹤而對 LLM 輸出加浮水印
以進階技術為 LLM 生成文字加浮水印以建立來源記錄,涵蓋部署架構、多位元編碼方案、穩健性考量,以及浮水印在 AI 安全與問責框架中的角色。
watermarkingprovenanceoutput-trackingaccountabilitydetection
輸出浮水印作為防禦
於 LLM 應用中利用輸出浮水印進行內容來源追蹤與濫用偵測。
defensewatermarkingoutputprovenance
嵌入浮水印攻擊
攻擊或繞過嵌入浮水印機制,以隱匿模型盜竊、重新訓練或未授權使用的證據。
embeddingwatermarkingdetectionevasion
浮水印移除技術
LLM 浮水印方案的移除與規避技術。
frontierwatermarkingremoval
Lab: LLM Watermark Detection and Removal
Detect and analyze LLM text 浮水印s using statistical methods and test 浮水印 removal through paraphrasing.
labswatermarkingdetection-removaladvanced
Lab: AI Watermark Detection & Removal
動手實作 exploring 技術 for detecting and removing statistical 浮水印s embedded in AI-generated text, and evaluating 浮水印 robustness.
labexpertwatermarkingdetectionhands-on
回應浮水印實作
實作回應浮水印,以實現可追溯性並偵測 LLM 輸出的未授權重製。
walkthroughsdefensewatermarkingtraceability