# capstone
標記為「capstone」的 54 篇文章
頂石專案:設計並舉辦對抗性 ML 競賽
設計、打造並營運奪旗 (CTF) 風格的對抗性 ML 競賽,具備自動化評分、多樣化的挑戰類別,以及即時排行榜。
總結專案:端到端代理式 AI 系統滲透測試
針對具備工具使用、多步推理與自主決策能力的代理式 AI 系統執行完整的滲透測試。
總結專案:實作 AI 合規框架
建置全面的 AI 合規框架,將安全測試對應至 EU AI Act、NIST AI RMF 與 ISO 42001 等監管要求。
總結專案:建置 AI 事件回應系統
設計並實作專為 AI 安全事件打造的事件回應系統,涵蓋提示詞注入入侵、模型操控,以及經由 LLM 應用程式的資料外洩。
總結專案:建置完整的 AI 紅隊演練平台
設計並實作全面的 AI 紅隊演練平台,具備自動化攻擊編排、漏洞追蹤與協作式報告能力。
Capstone:設計並實作 AI 安全基準測試套件
打造完整、可重現的基準測試套件,評估 LLM 在多個風險維度(毒性、偏見、幻覺與對抗穩健性)上的安全性。
Capstone:自主代理評估
Capstone 演練:對具多工具存取權之完全自主代理系統的紅隊評估。
Capstone:自駕車 AI 安全
自駕車 AI 決策系統的全範疇安全評估,涵蓋感知操弄、規劃攻擊與安全覆寫繞過。
Capstone:程式碼助理評估
Capstone 演練:對具 repository 與 CI/CD 存取權之 AI 程式碼助理的安全評估。
Capstone:自訂安全工具開發
從零打造自訂 AI 安全測試工具,涵蓋架構設計、模組開發,以及與現有框架整合。
Capstone:防禦架構設計
Capstone 演練:為 LLM 驅動應用設計並驗證縱深防禦架構。
Capstone:教育 AI 平台
AI 輔導平台的安全評估,涉及內容安全、學生資料隱私與學術誠信。
Capstone:企業 AI 安全計畫
Capstone 演練:為大型組織設計並實作完整 AI 安全計畫,涵蓋治理、技術控制、事件回應與培訓。
Capstone:企業 RAG 評估
Capstone 演練:對具角色型存取控制之企業 RAG 系統的完整紅隊評估。
Capstone:金融 AI 評估
Capstone 演練:對具監管合規要求之金融 AI 顧問的紅隊評估。
Capstone:完整聊天機器人演練
完整 Capstone 演練:對生產級聊天機器人系統進行完整紅隊演練。
Capstone:以 Garak 進行深入評估
以 Garak 進行完整漏洞掃描的工具專屬 Capstone,包括 plugin 開發與自訂 probe 建立。
Capstone:AI 治理稽核
Capstone 演練:進行涵蓋合規、風險與營運控制的完整 AI 治理稽核。
Capstone:醫療 AI 評估
Capstone 演練:具 HIPAA 與病患安全要求的醫療 AI 系統安全評估。
Capstone:AI 事件回應演練
Capstone 演練:執行從偵測到修復的完整 AI 事件回應演練。
Capstone:法律 AI 審閱系統
AI 驅動法律文件審閱系統的端對端安全評估,涵蓋資料機密性、輸出完整性與對抗操弄。
Capstone:LLM 防火牆
Capstone 專案:從零打造生產級 LLM 防火牆,處理提示詞注入、編碼繞過、多訊息攻擊與工具呼叫濫用。
Capstone:LLM 漏洞資料庫
Capstone 專案:設計並實作 LLM 漏洞追蹤資料庫,處理模型版本、組態、溫度與護欄造成的變動。
Capstone:媒體內容 AI 評估
Capstone 演練:對媒體內容產生與審核 AI 系統的安全評估。
Capstone:醫療 AI 系統評估
醫療 AI 診斷系統的完整紅隊評估,涉及病患安全、資料隱私與監管合規。
Capstone:模型安全稽核
Capstone 演練:對部署中的 LLM 進行完整安全稽核,涵蓋攻擊面測試、護欄評估與合規檢查。
Capstone:多代理系統評估
Capstone 演練:對具 MCP 與 A2A 的多代理平台進行端對端安全評估。
Capstone:多代理系統評估(Capstone)
評估具工具使用、記憶體與代理間通訊的複雜多代理系統安全,涵蓋完整代理式攻擊面。
Capstone:多模態攻擊套件
Capstone 專案:打造針對視覺、音訊與文件多模態 AI 系統的攻擊測試套件。
Capstone:多模態系統評估
Capstone 演練:處理影像、文件與文字之多模態 AI 系統的紅隊評估。
Capstone:開源模型安全稽核
Capstone 演練:對開源模型(Llama、Mistral、Qwen)的權重、微調與部署進行完整安全稽核。
Capstone:提示詞注入掃描器
Capstone 專案:打造全面的提示詞注入掃描器,整合多種偵測技術、載荷資料庫與 CI 整合。
Capstone:以 Promptfoo 進行持續測試
將 Promptfoo 整合進 CI/CD 管道實現持續 AI 安全測試,用於自動化迴歸測試與安全驗證。
Capstone:以 PyRIT 進行完整演練
使用 Microsoft PyRIT 的完整紅隊演練,涵蓋攻擊策略設定、多輪編排與自動化評分。
Capstone:RAG 安全評估
Capstone 演練:對 RAG 系統的完整安全評估,涵蓋檢索投毒、索引污染、答案外洩與存取控制。
Capstone:零售 AI 評估
完整 Capstone 演練:對具推薦引擎與聊天機器人之零售 AI 系統的紅隊評估。
Capstone:供應鏈 AI 安全
AI 驅動供應鏈優化的紅隊評估,涵蓋資料投毒、決策操弄與營運中斷。
Capstone:ML 供應鏈稽核
Capstone 演練:為組織進行完整 ML 供應鏈安全稽核。
Capstone:供應鏈安全工具
Capstone 專案:打造 AI/ML 供應鏈安全工具,驗證模型權重、資料集與依賴的完整性與來源。
執行與報告
如何執行 AI 紅隊委任並交付專業發現,包括證據蒐集、統計回報,以及修復指引。
完整案件方法論
進行完整 AI 紅隊案件的全面方法論,將先前章節的所有技術整合為結構化專業評估。
委任規劃與範疇界定
如何規劃並界定 AI 紅隊委任的範圍,包括目標設定、交戰規則、成功判準與方法論選擇。
Capstone:代理式紅隊演練
Capstone 演練:對多代理、工具使用系統進行完整紅隊演練,涵蓋工具濫用、記憶攻擊與代理間操弄。
Capstone:雲端 AI 評估
Capstone 演練:對企業雲端 AI 部署的完整安全評估,涵蓋 IAM、網路、資料與模型層。
頂石專案:合規評估模擬
針對歐盟 AI Act、NIST AI RMF 與 ISO 42001 進行模擬合規評估,產出完整的差距分析報告。
頂石專案:防禦系統實作
打造含輸入過濾、輸出監控、護欄、速率限制與日誌的完整 AI 防禦堆疊,再以自動化攻擊進行評估。
頂石專案:完整紅隊演練專案
針對包含聊天機器人、RAG、代理與 API 各層的多元件 AI 應用,進行完整 AI 紅隊演練的範圍界定、規劃、執行與報告撰寫。
頂石專案:AI 事件回應演練
透過分流、調查、圍堵、修復與事後檢討報告,回應一場模擬的 AI 安全事件。
Capstone:開源 AI 安全貢獻
Capstone 專案:對開源 AI 安全工具或資料集做出有意義貢獻,包括新測試、文件或程式碼改進。
頂石專案:訓練管道攻擊與防禦
透過資料投毒與後門植入攻擊模型訓練管道,再建置偵測並阻止這些攻擊的防禦機制。
頂石專案:紅隊計畫設計
為虛構企業設計完整的 AI 紅隊計畫,產出完整的計畫章程文件。
頂石專案:打造 AI 安全掃描器
設計並實作自動化 AI 安全測試工具,支援提示詞注入偵測、越獄測試與輸出分析。
頂石專案:產業垂直深入研究
選擇一個產業垂直,對其中的 AI 系統建立威脅模型,並產出專屬該產業的 AI 安全測試指南。
頂石專案:漏洞研究專案
辨識並負責任揭露一類新穎的 AI 漏洞,產出顧問級撰寫、概念驗證與 MITRE ATLAS 對應。