# challenge

標記為「challenge」的 24 篇文章

Timed Challenge 模擬測驗 1

Timed challenge exam與strict time limits to test knowledge recall、decision-making under pressure。

assessmentspractice-examtimedchallenge

進階

2026 年 4 月：防禦建構挑戰

為聊天機器人打造最強韌的防禦系統，並對照 500 個多樣化提示詞注入與越獄嘗試的自動化攻擊套件進行評分。

challengedefenseblue-teamhardeningchatbotapril-2026

中級

2026 年 8 月：多模型 Boss Rush

在複雜的多模型系統中跨 GPT-4、Claude 與 Gemini 鏈接攻擊，利用模型間的信任邊界與交接點。

challengemulti-modelchainingboss-rushcross-modelaugust-2026

專家

2026 年 2 月：越獄創新挑戰

開發針對強化語言模型的新穎越獄技巧，並以可再現性證據撰寫文件。評審依據新穎度、可靠度與可轉移性。

challengejailbreakinnovationtechniquesfebruary-2026

中級

2026 年 1 月：系統提示詞萃取挑戰

從五個防禦層層升級之聊天機器人萃取系統提示詞，由無防護逐步升級至強化加固配置。

challengesystem-promptextractionprompt-injectionjanuary-2026

中級

2026 年 7 月：供應鏈稽核挑戰

稽核某 ML 專案的完整供應鏈安全問題，涵蓋依賴、模型來源、資料管線、訓練基礎設施與部署工件。

challengesupply-chainauditdependenciesprovenancejuly-2026

進階

2026 年 6 月：雲端 AI 安全挑戰

發掘並記錄雲端部署 AI 服務中的漏洞，涵蓋 API 安全、模型服務基礎設施、認證與資料處理。

challengecloudinfrastructureapi-securitydeploymentjune-2026

中級

2026 年 3 月：代理利用挑戰

經提示注入與工具濫用破壞多工具代理系統，以升級之難度與分數值完成多個目標。

challengeagentexploitationprompt-injectiontoolsmarch-2026

進階

2026 年 5 月：RAG 投毒挑戰

將惡意文件注入檢索增強生成系統以控制特定查詢的回應，同時不干擾正常運作。

challengeragpoisoningretrievalinjectionmay-2026

進階

2026 年 11 月：完整委任挑戰

完成自範圍界定至最終報告交付之現實紅隊委任模擬，產出專業級交付物。

challengefull-engagementred-teamprofessionalreportnovember-2026

專家

2026 年 10 月：DEF CON AI Village 挑戰

重現並擴展 AI Village 演講與工作坊之攻擊，建立於已發表研究之上以發展實務利用技術。

challengedefconai-villageresearchreproductionoctober-2026

進階

2026 年 9 月：事件回應挑戰

從日誌、工件與系統追蹤調查模擬的 AI 安全事件。重建攻擊時間軸、辨識根本原因，並撰寫事件報告。

challengeincident-responseforensicsinvestigationlogsseptember-2026

中級

防禦挑戰:偵測工程

專注於打造提示詞注入偵測系統的挑戰,依真陽性率與假陽性率評分。

communitychallengedefensedetection

中級

防禦挑戰:打造無法突破的護欄

參與者打造須承受自動攻擊套件的護欄系統,依安全性與可用性指標評分。

communitychallengedefenseguardrails

進階

月度挑戰:代理獵人

每月挑戰聚焦於發掘與利用代理式 AI 系統的漏洞。

communitychallengeagentmonthly

進階

月度挑戰:防禦建造者

每月挑戰打造對特定攻擊技術集最穩健的防禦。

communitychallengedefensemonthly

中級

月度挑戰:注入奧運

每月社群挑戰,聚焦於跨多模型的創意提示詞注入技術。

communitychallengeinjectionmonthly

中級

研究挑戰:攻擊可解釋性

社群研究挑戰,聚焦於以可解釋性與機制分析方法理解特定對抗技術為何成功。

communitychallengeresearchinterpretability

進階

研究挑戰:跨模型轉移

研究導向挑戰,探討對抗技術跨模型家族的可轉移性,並發表成果。

communitychallengeresearchtransfer

進階

週挑戰:盲注入系列

一系列無直接輸出回饋的注入攻擊挑戰,迫使參與者發展側通道觀察技術。

communitychallengeblind-injectionweekly

中級

週挑戰:防禦逆向工程

每週挑戰中,參與者逆向工程未知防禦機制,找出繞過技術並記錄發現。

communitychallengedefensereverse-engineering

中級

週挑戰:編碼挑戰關

每週挑戰系列聚焦於透過創意載荷構造,繞過日益複雜的編碼式防禦。

communitychallengeencodingweekly

中級

Data Heist Challenge

萃取a secret database of customer records from a RAG-enabled chatbot with strict data access controls.

heistctfchallengedatalabs

進階

提示詞 Smuggler Challenge

Smuggle a specific payload through 5 layers of increasingly精密的 input filtering to capture the flag.

ctfsmugglerchallengepromptlabs

進階