# behavior-diffing
標記為「behavior-diffing」的 3 篇文章
Model Behavior Diffing
Comparing model behavior before and after incidents: output distribution analysis, safety regression detection, capability change measurement, and statistical significance testing.
behavior-diffingcomparisonregressionmodel-analysis
模型行為 Diffing
比較事件、更新或修改前後之模型行為:輸出分布分析、安全退化偵測、能力變化量測,以及統計顯著性檢定。
behavior-diffingcomparisonregressionmodel-analysis
模型鑑識
調查 AI 模型本身是否被入侵的鑑識技術——涵蓋後門偵測、行為比對、權重竄改分析與模型完整性驗證。
model-forensicsbackdoor-detectionbehavior-diffingweight-analysis