跳至主要內容
redteams
.ai
搜尋...
主題
詞彙表
部落格
ATT&CK 導覽器
挑戰
繁體中文
Loading...
所有標籤
#
trust-safety
標記為「trust-safety」的 1 篇文章
內容審查系統攻擊
攻擊 AI 驅動之內容審查系統。繞過分類器之對抗內容、為文字與圖像過濾器之逃避技術,與於平台規模不可靠審查之安全意涵。
content-moderation
trust-safety
bypass
進階