# case-studies
標記為「case-studies」的 32 篇文章
案例研究:AI 輔助惡意軟體產生事件
分析已記錄的事件,其中大型語言模型被用於產生、增強或混淆惡意軟體,包括對威脅面貌演進與防禦策略的意涵。
案例研究:AI 招聘系統偏見利用
分析針對 AI 招聘系統的對抗性攻擊,以及履歷篩選機制的漏洞利用。
案例研究:自主代理失效事件
分析真實世界中自主代理失效的案例,包括意外行動與安全違規。
案例研究:對自駕車感知系統的對抗攻擊
分析針對自駕車感知系統的對抗攻擊,包括停車標誌擾動、幻影物件注入與 LiDAR 欺騙,以及對安全關鍵 AI 部署的意涵。
案例研究:Bing Chat 間接注入
分析 Bing Chat 的間接提示詞注入事件,以及對瀏覽網頁型 AI 的啟示。
案例研究:Bing Chat「Sydney」越獄與人格浮現(2023)
分析 Bing Chat「Sydney」人格事件:Microsoft 的 AI 搜尋助理透過越獄技術表現出操弄行為、情緒脅迫與系統提示詞外洩。
案例研究:Samsung ChatGPT 機密資料外洩(2023)
詳細分析 Samsung 半導體工程師如何透過 ChatGPT 外洩專有原始碼與會議紀錄,引發產業對企業 AI 資料治理的反思。
案例研究:ChatGPT 外掛安全漏洞
分析 ChatGPT 外掛生態系中發現的安全漏洞,包括 OAuth 劫持、跨外掛資料外洩,以及透過外掛回應的提示詞注入。
案例研究:ChatGPT 外掛漏洞
分析 ChatGPT 外掛生態系中被揭露的真實漏洞,包含資料外洩與提示詞注入。
案例研究:GitHub Copilot 程式碼注入
透過惡意儲存庫內容對 GitHub Copilot 進行提示詞注入漏洞的分析。
案例研究:Copilot 漏洞產生
分析 GitHub Copilot 與 AI 程式助理產生不安全程式碼,對開發者與供應鏈造成的衝擊。
案例研究:DeepSeek 模型安全評估發現
對 DeepSeek 模型安全評估發現的完整分析,包括與 GPT-4 和 Claude 的比較評估、越獄脆弱性測試,以及對開源權重模型部署的啟示。
案例研究:2024 年選舉 AI Deepfake
分析 2024 全球選舉週期中已記錄的 AI 產生 deepfake 事件,包括 New Hampshire Biden 自動語音電話、斯洛伐克音訊 deepfake,以及對選舉誠信的更廣泛意涵。
案例研究:GPT-4 早期越獄
分析 GPT-4 早期越獄技術,包括 DAN、奶奶漏洞與開發者模式。
案例研究:GPT-4V 越獄
GPT-4 Vision 視覺越獄分析:排版攻擊、對抗擾動與影像中的隱寫術指令。
案例研究:醫療 AI 失效
已記錄的醫療 AI 失效分析,包括診斷錯誤、偏見與建議偏差,以及對病患安全的意涵。
案例研究:電子郵件間接提示詞注入
透過 email 檢索的間接提示詞注入攻擊分析,影響 Gmail AI、Outlook Copilot 與企業 AI 助理。
案例研究:LangChain CVE 分析
分析 LangChain CVE(包含 CVE-2023-29374、CVE-2023-36258)及其根本原因。
案例研究:LangChain RCE CVE
LangChain CVE(CVE-2023-29374、CVE-2023-44467 等)的分析,展示 LLM 工具鏈不受限程式碼執行的風險。
案例研究:律師引用幻覺判例
分析 Mata v. Avianca 案件 — 律師提交了由 AI 幻覺產生的法律引文。
案例研究:MCP 早期漏洞揭露
分析早期 MCP 漏洞揭露,包含 Invariant Labs 的工具投毒研究。
案例研究:MCP 工具投毒
針對 Model Context Protocol(MCP)伺服器的工具投毒攻擊分析,與生態系的信任模型挑戰。
案例研究:真實世界的模型萃取
分析針對商用 ML API 的模型萃取攻擊案例。
案例研究:Codex 模型投毒
對 GitHub Codex/Copilot 等程式模型透過 repository 注入的訓練期投毒分析。
案例研究:多模態越獄活動
分析針對 GPT-4V 與 Gemini 視覺能力的多模態越獄活動。
案例研究:Google Bard 提示詞注入
Google Bard(現稱 Gemini)中早期提示詞注入與資料外洩漏洞的分析。
案例研究:Samsung ChatGPT 資料外洩
分析 Samsung 機密程式碼透過 ChatGPT 外洩的事件,以及對組織 AI 政策的啟示。
案例研究:從 GPT 萃取訓練資料
分析 Carlini 等人從生產環境 ChatGPT 萃取訓練資料的研究。
重大 AI 安全事件
重大 AI 安全事件之完整時間軸與分析,自 Bing Chat jailbreak 到 ChatGPT 資料洩漏與實際代理攻擊。含每起事件之根本原因分析與影響評估。
已發表紅隊報告分析
自 Anthropic、OpenAI、Google DeepMind 與 METR 之已發表紅隊報告深入分析。方法論分解、關鍵發現,與如何讀取並自專業紅隊評估學習。
案例研究
真實世界 AI 安全事件、領域特定案例研究、事件分析報告與平台安全評估,以實務經驗為理論知識奠基。
生產系統中的提示詞注入
生產 AI 部署中提示詞注入利用的真實案例研究,包括攻擊時序、影響分析與經驗教訓。