音訊與語音模型
Intermediate1 min readUpdated 2026-03-15
語音辨識與音訊處理 AI 的安全——涵蓋對抗性音訊、語音複製風險、隱藏命令與音訊注入技術。
語音與音訊處理 AI 引入文字處理不存在的獨特攻擊面。對抗性音訊可嵌入人類聽不到但 AI 識別為命令的訊號。語音複製可冒充授權使用者。隱藏命令可觸發 AI 代理採取未授權動作。
語音辨識與音訊處理 AI 的安全——涵蓋對抗性音訊、語音複製風險、隱藏命令與音訊注入技術。
語音與音訊處理 AI 引入文字處理不存在的獨特攻擊面。對抗性音訊可嵌入人類聽不到但 AI 識別為命令的訊號。語音複製可冒充授權使用者。隱藏命令可觸發 AI 代理採取未授權動作。
攻擊自動語音辨識系統,包括轉錄結果與聽感不同的對抗音訊、隱藏語音指令,以及背景音訊注入。
打造對抗音訊擾動的技術,含心理聲學隱藏、頻域攻擊,以及 over-the-air 對抗音訊。
以語音複製對 AI 系統進行社交工程、繞過語音驗證、對語者驗證系統的攻擊,以及偵測技術。
使用 Python 音訊處理建立對抗音訊範例之實作,針對 Whisper 轉譯注入文字。
Comprehensive attack taxonomy for audio-enabled LLMs: adversarial audio generation, voice-based prompt injection, cross-modal split attacks, and ultrasonic perturbations.