# ocr
標記為「ocr」的 6 篇文章
文件 AI 系統攻擊
攻擊文件理解系統的技術,包括 OCR 管線、PDF 處理器和文件語言模型,透過版面配置操縱、隱藏文字和元資料注入等手法。
multimodaldocumentocrpdflayout
OCR 對抗性攻擊
透過精心設計的影像使 OCR 系統擷取出對抗性文字,以進行後續的注入攻擊。
multimodalocradversarialtext-recognition
視覺-語言模型
視覺-語言模型(VLM)的安全評估——涵蓋 VLM 架構、圖片注入技術、OCR 與字型攻擊、對抗性圖片生成與 VLM 特定越獄。
vlmvisionimage-injectionocradversarial-imagesmultimodal
OCR 與排版攻擊
經由排版攻擊、字體操弄、對抗文字覆蓋,與文字渲染利用來利用 VLM 中之 OCR 能力。
ocrtypographyvisual-attacksvlm
多模態文字注入向量
透過非文字模態注入對抗性文字指令,包含嵌入文字的影像、音訊轉錄與文件解析。
prompt-injectionmultimodalvisionaudioocr
OCR-Based 攻擊s
利用ing Optical Character Recognition processing pipelines to inject adversarial text into AI systems, targeting the gap between what OCR extracts and what humans see.
multimodalocrprompt-injectiontext-extractionred-teaming