# audio
標記為「audio」的 17 篇文章
多模態攻擊評量
以 10 道中級題目測試你對針對多模態 AI 系統之攻擊(包括基於影像的注入、音訊對抗性範例與跨模態操縱)的理解。
實作:音訊對抗樣本
動手實作 for crafting 對抗性 audio perturbations that cause speech-to-text models and voice assistants to misinterpret spoken commands, demonstrating attacks on audio AI systems.
Audio 注入 via Speech-to-Text 模型
Craft adversarial audio that embeds 提示詞注入 payloads when transcribed by speech-to-text models.
模擬:語音助理紅隊
針對部署於智慧家庭平台之 AI 語音助理之紅隊委任模擬,涵蓋音訊型提示注入、喚醒詞利用,以及隱私外洩。
對抗性音訊範例
打造對抗音訊擾動的技術,含心理聲學隱藏、頻域攻擊,以及 over-the-air 對抗音訊。
Audio Modality 攻擊s
Comprehensive attack taxonomy for audio-enabled LLMs: adversarial audio generation, voice-based prompt injection, cross-modal split attacks, and ultrasonic perturbations.
音訊模型攻擊面
音訊模型安全概覽,包括對 Whisper、語音轉文字系統、語音助理以及音訊處理管線的攻擊。
實作:打造音訊對抗範例
使用 Python 音訊處理建立對抗音訊範例之實作,針對 Whisper 轉譯注入文字。
語音辨識攻擊
攻擊自動語音辨識系統,包括轉錄結果與聽感不同的對抗音訊、隱藏語音指令,以及背景音訊注入。
語音複製與深偽音訊
以語音複製對 AI 系統進行社交工程、繞過語音驗證、對語者驗證系統的攻擊,以及偵測技術。
語音與音訊模型的對抗性攻擊
針對語音辨識、語音助理與音訊語言模型(包括隱藏命令與心理聲學遮蔽)製作對抗性音訊的技術。
音訊頻率注入攻擊
利用可聽範圍之外或受抑制頻段注入指令,繞過語音介面的防禦。
音訊隱藏命令
在對人耳不明顯的音訊中嵌入指令,控制語音助理與多模態 AI 系統。
音訊注入攻擊
透過音訊管道注入惡意指令或對抗性內容,操弄多模態 AI 模型行為。
多模態安全
多模態 AI 系統 (處理影像、音訊、影片與跨模態輸入) 的安全評估,涵蓋視覺語言模型、語音系統、影片分析與跨模態攻擊技術。
多模態文字注入向量
透過非文字模態注入對抗性文字指令,包含嵌入文字的影像、音訊轉錄與文件解析。
音訊提示詞注入
透過音訊輸入向語音轉文字和多模態模型注入對抗性指令,利用音訊通道作為替代注入向量。