# challenge
標記為「challenge」的 24 篇文章
Timed Challenge 模擬測驗 1
Timed challenge exam與strict time limits to test knowledge recall、decision-making under pressure。
2026 年 4 月:防禦建構挑戰
為聊天機器人打造最強韌的防禦系統,並對照 500 個多樣化提示詞注入與越獄嘗試的自動化攻擊套件進行評分。
2026 年 8 月:多模型 Boss Rush
在複雜的多模型系統中跨 GPT-4、Claude 與 Gemini 鏈接攻擊,利用模型間的信任邊界與交接點。
2026 年 2 月:越獄創新挑戰
開發針對強化語言模型的新穎越獄技巧,並以可再現性證據撰寫文件。評審依據新穎度、可靠度與可轉移性。
2026 年 1 月:系統提示詞萃取挑戰
從五個防禦層層升級之聊天機器人萃取系統提示詞,由無防護逐步升級至強化加固配置。
2026 年 7 月:供應鏈稽核挑戰
稽核某 ML 專案的完整供應鏈安全問題,涵蓋依賴、模型來源、資料管線、訓練基礎設施與部署工件。
2026 年 6 月:雲端 AI 安全挑戰
發掘並記錄雲端部署 AI 服務中的漏洞,涵蓋 API 安全、模型服務基礎設施、認證與資料處理。
2026 年 3 月:代理利用挑戰
經提示注入與工具濫用破壞多工具代理系統,以升級之難度與分數值完成多個目標。
2026 年 5 月:RAG 投毒挑戰
將惡意文件注入檢索增強生成系統以控制特定查詢的回應,同時不干擾正常運作。
2026 年 11 月:完整委任挑戰
完成自範圍界定至最終報告交付之現實紅隊委任模擬,產出專業級交付物。
2026 年 10 月:DEF CON AI Village 挑戰
重現並擴展 AI Village 演講與工作坊之攻擊,建立於已發表研究之上以發展實務利用技術。
2026 年 9 月:事件回應挑戰
從日誌、工件與系統追蹤調查模擬的 AI 安全事件。重建攻擊時間軸、辨識根本原因,並撰寫事件報告。
防禦挑戰:偵測工程
專注於打造提示詞注入偵測系統的挑戰,依真陽性率與假陽性率評分。
防禦挑戰:打造無法突破的護欄
參與者打造須承受自動攻擊套件的護欄系統,依安全性與可用性指標評分。
月度挑戰:代理獵人
每月挑戰聚焦於發掘與利用代理式 AI 系統的漏洞。
月度挑戰:防禦建造者
每月挑戰打造對特定攻擊技術集最穩健的防禦。
月度挑戰:注入奧運
每月社群挑戰,聚焦於跨多模型的創意提示詞注入技術。
研究挑戰:攻擊可解釋性
社群研究挑戰,聚焦於以可解釋性與機制分析方法理解特定對抗技術為何成功。
研究挑戰:跨模型轉移
研究導向挑戰,探討對抗技術跨模型家族的可轉移性,並發表成果。
週挑戰:盲注入系列
一系列無直接輸出回饋的注入攻擊挑戰,迫使參與者發展側通道觀察技術。
週挑戰:防禦逆向工程
每週挑戰中,參與者逆向工程未知防禦機制,找出繞過技術並記錄發現。
週挑戰:編碼挑戰關
每週挑戰系列聚焦於透過創意載荷構造,繞過日益複雜的編碼式防禦。
Data Heist Challenge
萃取a secret database of customer records from a RAG-enabled chatbot with strict data access controls.
提示詞 Smuggler Challenge
Smuggle a specific payload through 5 layers of increasingly精密的 input filtering to capture the flag.