# cross-modal
標記為「cross-modal」的 12 篇文章
進階多模態評估
In-depth 評估 of cross-modal 攻擊 vectors包括 image injection、audio manipulation、隱寫術技巧。
技能驗證: 多模態 Attack Execution
針對以下的實作驗證:image injection、audio manipulation、cross-modal transfer 攻擊。
多模態嵌入向量攻擊
利用 CLIP 等跨模態嵌入模型——對抗性圖文對齊操控、跨模態注入與對多模態檢索系統的攻擊。
跨模態 Embedding 攻擊
跨模態之共享 embedding 空間利用:CLIP 對抗影像、印刷式攻擊、VLM 注入與維度縮減攻擊。
跨模態攻擊
跨多個輸入模態串接漏洞的攻擊——涵蓋基於文件的攻擊、多模態越獄、模態橋接與資訊洩漏。
Cross-Modal Information Leakage
Techniques for extracting sensitive information through modality boundary violations, including system prompt leakage via image descriptions, context window dumping through multi-modal queries, and side-channel attacks across modalities.
Multimodal 防禦 Strategies
Comprehensive defense approaches for multimodal AI systems: cross-modal verification, perceptual hashing, NSFW detection, input sanitization, and defense-in-depth architectures.
跨模態傳遞攻擊實作指南
在多模態模型中,透過一個輸入通道攻擊另一模態處理流程的對抗性輸入技術,涵蓋圖像轉文字、音訊轉行動,以及文件轉工具的攻擊鏈。
跨模態傳遞攻擊
攻擊者如何將對抗樣本從一個模態轉移到另一個模態,以提升攻擊的通用性與可轉移性。
多模態安全
多模態 AI 系統 (處理影像、音訊、影片與跨模態輸入) 的安全評估,涵蓋視覺語言模型、語音系統、影片分析與跨模態攻擊技術。
多模態模型中的對齊挑戰
分析多模態 AI 系統特有的對齊挑戰,包括跨模態安全缺口、表示衝突,以及將基於文字的安全訓練延伸至視覺、音訊和視頻輸入的困難。
Cross-Modal Confusion
Confusing multimodal AI models by sending conflicting or complementary signals across different input modalities to bypass safety mechanisms and exploit fusion weaknesses.