跳至主要內容
redteams
.ai
搜尋...
主題
詞彙表
部落格
ATT&CK 導覽器
挑戰
繁體中文
Loading...
所有標籤
#
model-tampering
標記為「model-tampering」的 1 篇文章
微調攻擊鑑識
偵測對語言模型未授權微調修改的鑑識技術,涵蓋安全對齊退化與能力注入。
ai-forensics-ir
fine-tuning
model-tampering
alignment
進階