Loading...
標記為「stable-diffusion」的 1 篇文章
理解並評估文字生成影像擴散模型的對抗性攻擊,包括提示詞操控以繞過安全過濾、概念消除攻擊、引導機制擾動,以及訓練資料成員推論。