IR 劇本
中級1 分鐘閱讀更新於 2026-03-15
AI 安全事件的逐步應變劇本——涵蓋越獄事件、提示詞注入入侵、資料外洩、模型竄改與代理工具濫用。
事件應變劇本為特定事件類型提供逐步程序。不同於通用 IR 框架,劇本是具體可行的:它們告訴你現在對此特定情境該做什麼。
可用劇本
| 劇本 | 觸發條件 | 嚴重性 |
|---|---|---|
| 越獄事件 | 模型產生違反安全政策的內容 | 中-高 |
| 提示詞注入入侵 | 偵測到成功提示詞注入影響模型行為 | 高 |
| 資料外洩 | 模型在輸出中洩漏敏感資訊 | 高-關鍵 |
| 模型竄改 | 懷疑模型權重或設定被修改 | 關鍵 |
| 代理工具濫用 | 代理執行未授權工具呼叫 | 高-關鍵 |
| RAG 投毒 | 知識庫中發現惡意文件 | 高 |
劇本結構
每個劇本遵循相同結構:即時遏制(前 15 分鐘做什麼)、調查(收集什麼證據、分析什麼日誌)、修復(如何修復並驗證修復)、溝通(通知誰、說什麼)、事後行動(更新什麼防禦、記錄什麼教訓)。