# case-studies

標記為「case-studies」的 32 篇文章

案例研究:AI 輔助惡意軟體產生事件

分析已記錄的事件,其中大型語言模型被用於產生、增強或混淆惡意軟體,包括對威脅面貌演進與防禦策略的意涵。

case-studiesmalwareai-assisted-attacksthreat-landscapeoffensive-ai

進階

案例研究:AI 招聘系統偏見利用

分析針對 AI 招聘系統的對抗性攻擊,以及履歷篩選機制的漏洞利用。

case-studieshiringbiasexploitation

中級

案例研究:自主代理失效事件

分析真實世界中自主代理失效的案例,包括意外行動與安全違規。

case-studiesautonomous-agentsfailuresincidents

進階

案例研究:對自駕車感知系統的對抗攻擊

分析針對自駕車感知系統的對抗攻擊,包括停車標誌擾動、幻影物件注入與 LiDAR 欺騙,以及對安全關鍵 AI 部署的意涵。

case-studiesautonomous-vehiclesadversarial-attackscomputer-visionphysical-adversarialsafety-critical

進階

案例研究:Bing Chat 間接注入

分析 Bing Chat 的間接提示詞注入事件,以及對瀏覽網頁型 AI 的啟示。

case-studiesbing-chatindirect-injectionmicrosoft

中級

案例研究:Bing Chat「Sydney」越獄與人格浮現(2023)

分析 Bing Chat「Sydney」人格事件:Microsoft 的 AI 搜尋助理透過越獄技術表現出操弄行為、情緒脅迫與系統提示詞外洩。

case-studiesbing-chatsydneyjailbreakmicrosoftpersona-manipulation

中級

案例研究:Samsung ChatGPT 機密資料外洩(2023)

詳細分析 Samsung 半導體工程師如何透過 ChatGPT 外洩專有原始碼與會議紀錄,引發產業對企業 AI 資料治理的反思。

case-studiesdata-leakchatgptsamsungenterprise-securitydata-governance

中級

案例研究:ChatGPT 外掛安全漏洞

分析 ChatGPT 外掛生態系中發現的安全漏洞,包括 OAuth 劫持、跨外掛資料外洩,以及透過外掛回應的提示詞注入。

case-studieschatgptpluginsoauthdata-exfiltration

進階

案例研究:ChatGPT 外掛漏洞

分析 ChatGPT 外掛生態系中被揭露的真實漏洞,包含資料外洩與提示詞注入。

case-studieschatgptpluginsvulnerabilities

中級

案例研究:GitHub Copilot 程式碼注入

透過惡意儲存庫內容對 GitHub Copilot 進行提示詞注入漏洞的分析。

case-studiescopilotcode-injectionsupply-chain

中級

案例研究:Copilot 漏洞產生

分析 GitHub Copilot 與 AI 程式助理產生不安全程式碼,對開發者與供應鏈造成的衝擊。

case-studiescopilotcode-generationsupply-chainvulnerability

進階

案例研究:DeepSeek 模型安全評估發現

對 DeepSeek 模型安全評估發現的完整分析,包括與 GPT-4 和 Claude 的比較評估、越獄脆弱性測試,以及對開源權重模型部署的啟示。

case-studiesdeepseeksafety-evaluationopen-weightjailbreakbenchmarks

中級

案例研究:2024 年選舉 AI Deepfake

分析 2024 全球選舉週期中已記錄的 AI 產生 deepfake 事件,包括 New Hampshire Biden 自動語音電話、斯洛伐克音訊 deepfake,以及對選舉誠信的更廣泛意涵。

case-studiesdeepfakeselectionsdisinformationaudio-synthesis2024-elections

中級

案例研究:GPT-4 早期越獄

分析 GPT-4 早期越獄技術,包括 DAN、奶奶漏洞與開發者模式。

case-studiesgpt-4jailbreakshistory

中級

案例研究:GPT-4V 越獄

GPT-4 Vision 視覺越獄分析:排版攻擊、對抗擾動與影像中的隱寫術指令。

case-studiesgpt-4vmultimodalvisionjailbreakadversarial-images

進階

案例研究:醫療 AI 失效

已記錄的醫療 AI 失效分析,包括診斷錯誤、偏見與建議偏差,以及對病患安全的意涵。

case-studieshealthcarepatient-safetyalgorithmic-biasclinical-airegulatory

中級

案例研究:電子郵件間接提示詞注入

透過 email 檢索的間接提示詞注入攻擊分析,影響 Gmail AI、Outlook Copilot 與企業 AI 助理。

case-studiesindirect-prompt-injectionemaildata-exfiltrationai-assistants

進階

案例研究:LangChain CVE 分析

分析 LangChain CVE(包含 CVE-2023-29374、CVE-2023-36258)及其根本原因。

case-studieslangchaincveanalysis

中級

案例研究:LangChain RCE CVE

LangChain CVE(CVE-2023-29374、CVE-2023-44467 等)的分析,展示 LLM 工具鏈不受限程式碼執行的風險。

case-studieslangchainrcecvesupply-chaincode-execution

進階

案例研究:律師引用幻覺判例

分析 Mata v. Avianca 案件 — 律師提交了由 AI 幻覺產生的法律引文。

case-studieshallucinationlegalcitations

入門

案例研究:MCP 早期漏洞揭露

分析早期 MCP 漏洞揭露,包含 Invariant Labs 的工具投毒研究。

case-studiesmcpvulnerabilitiestool-poisoning

中級

案例研究:MCP 工具投毒

針對 Model Context Protocol(MCP)伺服器的工具投毒攻擊分析,與生態系的信任模型挑戰。

case-studiesmcptool-poisoninginvariant-labsagent-securityprompt-injection

進階

案例研究:真實世界的模型萃取

分析針對商用 ML API 的模型萃取攻擊案例。

case-studiesmodel-extractionreal-worldapi

進階

案例研究:Codex 模型投毒

對 GitHub Codex/Copilot 等程式模型透過 repository 注入的訓練期投毒分析。

case-studiesdata-poisoningcode-generationcopilotcodexsupply-chain

進階

案例研究:多模態越獄活動

分析針對 GPT-4V 與 Gemini 視覺能力的多模態越獄活動。

case-studiesmultimodaljailbreakscampaigns

進階

案例研究:Google Bard 提示詞注入

Google Bard(現稱 Gemini)中早期提示詞注入與資料外洩漏洞的分析。

case-studiesgooglebardgeminiprompt-injectionmultimodal

進階

案例研究:Samsung ChatGPT 資料外洩

分析 Samsung 機密程式碼透過 ChatGPT 外洩的事件,以及對組織 AI 政策的啟示。

case-studiessamsungdata-leakprivacy

入門

案例研究:從 GPT 萃取訓練資料

分析 Carlini 等人從生產環境 ChatGPT 萃取訓練資料的研究。

case-studiestraining-dataextractionprivacy

進階

重大 AI 安全事件

重大 AI 安全事件之完整時間軸與分析，自 Bing Chat jailbreak 到 ChatGPT 資料洩漏與實際代理攻擊。含每起事件之根本原因分析與影響評估。

incidentscase-studiessecurityhistory

中級

已發表紅隊報告分析

自 Anthropic、OpenAI、Google DeepMind 與 METR 之已發表紅隊報告深入分析。方法論分解、關鍵發現，與如何讀取並自專業紅隊評估學習。

reportsanalysiscase-studiesmethodology

進階

案例研究

真實世界 AI 安全事件、領域特定案例研究、事件分析報告與平台安全評估，以實務經驗為理論知識奠基。

case-studiesincidentsdomainsplatformsreal-worldanalysis

入門

生產系統中的提示詞注入

生產 AI 部署中提示詞注入利用的真實案例研究,包括攻擊時序、影響分析與經驗教訓。

productioncase-studiesreal-worldprompt-injectionincidents

中級