What is 季度競賽概觀?

每季一次之 capture-the-flag 競賽概觀，涵蓋自提示注入到進階攻擊研究之 AI 安全主題。

What is 社群貢獻挑戰?

如何提交你自己之 AI 安全挑戰至社群，含審查過程、品質標準與貢獻指引。

What is January 2026: System Prompt Extraction Challenge?

Extract system prompts from five increasingly defended chatbots, progressing from unprotected to heavily hardened configurations.

What is February 2026: 越獄 Innovation Challenge?

Develop novel jailbreak techniques against hardened language models and document them with reproducibility evidence. Judged on novelty, reliability, and transferability.

What is 2026 年 3 月：代理利用挑戰?

經提示注入與工具濫用破壞多工具代理系統，以升級之難度與分數值完成多個目標。

What is April 2026: 防禦 Building Challenge?

Build the most robust defense system for a chatbot, scored against an automated attack suite of 500 diverse prompt injection and jailbreak attempts.

What is May 2026: RAG 投毒 Challenge?

Inject malicious documents into a retrieval-augmented generation system to control responses for specific queries without disrupting normal operation.

What is June 2026: Cloud AI 安全 Challenge?

Find and document vulnerabilities in a cloud-deployed AI service covering API security, model serving infrastructure, authentication, and data handling.

What is July 2026: Supply Chain Audit Challenge?

Audit an ML project's entire supply chain for security issues including dependencies, model provenance, data pipelines, training infrastructure, and deployment artifacts.

What is August 2026: Multi-模型 Boss Rush?

Chain attacks across GPT-4, Claude, and Gemini in a complex multi-model system, exploiting trust boundaries and handoff points between models.

社群挑戰概觀

Beginner3 min readUpdated 2026-03-15

如何參與月度 AI 紅隊挑戰、賺取分數、分享結果，並與社群一同成長你之技能。

community challenges overview participation scoring

社群挑戰

社群挑戰計畫提供讓你於現實情境練習 AI 紅隊技能之結構化實作練習。每月帶來聚焦於學科不同領域之新挑戰——自提示提取至完整委任模擬。獨立工作、與同儕比較結果，並打造已展示能力之作品集。

為何參與

挑戰服務超越練習之數個目的：

技能驗證。 完成挑戰提供你能力之具體證據。每個挑戰具定義之評分準則使你可客觀量測你之進展。
技術發現。 於挑戰工作迫使你發展新穎途徑。領域中最有趣之技術某些已自 CTF 風格練習湧現。
社群學習。 於每個挑戰結束後，參與者分享其途徑。審查他人如何解決同一問題為擴展你技術劇目之最有效方式之一。
作品集打造。 已記錄之挑戰完成以認證單獨無法之方式對雇主與客戶展示實務技能。

挑戰如何運作

月度挑戰

新挑戰於每月之一日啟動。每個挑戰遵循此生命週期：

階段	時程	發生什麼
活躍	第 1-21 日	挑戰開放。獨立工作、經平台提交你之結果。於社群通道勿劇透。
討論	第 22-28 日	挑戰仍開放但允許討論。問問題、分享部分途徑、於卡住點協作。
審查	第 29 日-月底	解答與寫手被發布。為最佳寫手之社群投票。計分確定。

難度等級

挑戰以難度等級標記以助你選擇適切目標：

等級	預期背景	時間承諾
初學者	完成本 wiki 之基礎章節	2-4 小時
中等	熟悉提示注入與基礎代理利用	4-8 小時
進階	多步攻擊、工具利用、RAG 投毒之經驗	8-16 小時
專家	專業紅隊經驗或同等深度	16-40 小時

計分系統

每個挑戰定義其自身計分準則，但一般框架一致：

分數類別

目標完成（0-60 分）。 你達成陳述目標嗎？部分完成獲部分信用。
技術品質（0-20 分）。 你之途徑多乾淨、可靠與良好理解？10 中 9 次運作之技術較 10 中 1 次運作者計分較高。
文件（0-10 分）。 你是否清楚撰寫你之途徑使他人可重現？良好文件含你選擇背後之推理，非僅最終 payload。
創新（0-10 分）。 你發現新穎事物嗎？此可為新技術、非預期互動，或已知方法之創意應用。

計分層

層	分數	重要性
白金	90-100	具新穎貢獻之卓越表現
金	75-89	展示紮實方法論之強表現
銀	50-74	具改善空間之勝任執行
銅	25-49	顯示基礎理解之部分完成
參與者	1-24	已嘗試挑戰並提交結果

提交結果

於你提交含什麼

每個提交應含：

執行摘要。 描述你達成什麼及你整體途徑之一段。
環境設置。 你使用何工具、模型與組態。他人應可重現你之設置。
攻擊敘事。 你途徑之逐步描述，含死胡同與轉向。旅程與目的地同等重要。
證據。 展示你結果之截圖、記錄、對話紀錄或其他產物。
Payload 與技術。 你使用之實際提示、腳本或工具，配為何它們運作之解釋。
習得教訓。 何使你驚訝？你將以不同方式做什麼？你學得什麼？

提交格式

提交被接受為具嵌入程式碼區塊之 Markdown 文件。使用以下範本結構：

# [Challenge Name] - Submission by [Your Handle]
 
## Executive Summary
[One paragraph overview]
 
## Environment
- Model(s) tested: [list]
- Tools used: [list]
- Platform/API version: [details]
 
## Approach
### Phase 1: [Name]
[Description, reasoning, results]
 
### Phase 2: [Name]
[Description, reasoning, results]
 
## Evidence
[Screenshots, logs, transcripts]
 
## Payloads
[Code blocks with your actual techniques]
 
## Lessons Learned
[Reflections]

分享結果與寫手

於審查階段後，參與者被鼓勵發布詳細寫手。最佳寫手分享這些品質：

關於失敗之誠實。 記錄何未運作常較記錄何運作更具教育性。納入你之死胡同。
推理之解釋。 勿僅顯示 payload —— 解釋你為何認為它們將運作、你使用何心智模型，與你如何迭代。
與替代之比較。 若你嘗試多個途徑，解釋你為何選擇你所選與替代如何比較。
可重現性。 讀取你寫手之人應可遵循你之步驟並獲類似結果。

社群投票

於審查階段期間，社群成員可於三個類別對提交投票：

最具教育性 —— 教導最多之寫手
最具創意 —— 最新穎或最非預期之途徑
最佳文件 —— 最清楚、最可重現之寫手

每個類別中之獲勝者接收獎勵分數並於排行榜獲認可。

排行榜與排名

社群排行榜跨挑戰追蹤累積表現：

分數跨月累積。一致性被獎勵 —— 定期參與較偶爾高分更快打造你之分數。
為每個難度等級存在分離排行榜，故初學者與初學者競爭。
季度排名每季重置，予新參與者新鮮開始。
所有時間排名持續並反映對社群之持續貢獻。

行為準則

額外規則：

於活躍階段勿劇透。 分享你之興奮，非你之解答。
尊重其他參與者。 於寫手之建設性回饋受歡迎；不屑或菁英評論不。
歸屬借用之技術。 若你之途徑建立於他人之已發表工作，引用之。
負責任地回報平台問題。 若你於挑戰基礎設施本身（非挑戰目標）找到錯誤，回報組織者而非利用之。

挑戰類型

月度挑戰

月度挑戰為計畫之核心。每月聚焦特定 AI 安全主題 —— 提示提取、越獄研究、代理利用、防禦打造等。月度挑戰為獨立工作設計並執行整個日曆月。

月度挑戰系列遵循蓄意課程弧。年初挑戰聚焦基礎技術（提示提取、越獄）、年中挑戰處理中等與進階主題（代理利用、RAG 投毒、基礎設施安全），而年末挑戰建立向專業級練習（完整委任模擬、研究重現）。

你不需於一月開始。每個挑戰為自含且可獨立嘗試，雖較晚挑戰可能參照較早引入之技術。

工具	目的	何處取得
curl 或 httpie	API 互動	系統套件管理器
Python 3.10+	腳本化與自動化	python.org
jq	JSON 解析	系統套件管理器
文字編輯器或 IDE	撰寫提交與腳本	你之偏好
Burp Suite Community	HTTP 流量分析（為基礎設施挑戰）	portswigger.net

挑戰特定工具

某些挑戰需額外工具。這些於每個挑戰頁面列出。常見加入含：

Jupyter notebook 為資料分析挑戰（事件回應、鑑識）
Docker 為提供本地環境之挑戰
PyTorch 或 transformers 為模型層級挑戰
nmap 為基礎設施偵察挑戰

API 金鑰與存取

所有挑戰經社群挑戰平台存取。於建立帳戶後，你接收對挑戰端點之請求身分驗證之 API token。每個挑戰具其於其頁面記錄之端點集、速率限制與資源配額。

常見問題

我可以使用自動化工具（腳本、fuzzer、LLM）解挑戰嗎？

是，除非特定挑戰另有說明。使用工具為合法技能。然而，你必須於你提交記錄你之途徑 —— 無如何或為何運作解釋之成功自動化解答接收降低文件分數。

我可以於月度挑戰與他人協作嗎？

月度挑戰於活躍階段（第 1-21 日）為獨立工作設計。於討論階段（第 22-28 日），協作被鼓勵。為 CTF，團隊參與被明確支援。

若我於挑戰平台本身找到漏洞呢？

經社群平台上之負責任揭露通道回報組織者。真實平台漏洞賺取獎勵分數與認可。勿利用平台錯誤以獲不公平優勢。

過去挑戰過期嗎？

否。過去挑戰無限期保持可存取。自過去挑戰之分數計入你之所有時間排名，但不計入該月排行榜。

我可以重試我已提交之挑戰嗎？

是。你之最高分數被保留。於研究其他參與者寫手後重試為優秀學習策略。

入門

選擇你之第一個挑戰。 若你為新，以當月挑戰開始或於你難度等級選過去挑戰。
設置你之環境。 每個挑戰頁面列出你需之工具與存取。
通過工作。 預算難度等級指示之時間。勿急。
寫之。 即便你未完成每個目標，記錄你嘗試與學得什麼。
提交並互動。 提交你之結果，然後參與討論與審查階段。

以下之月度挑戰、季度競賽與社群貢獻挑戰為每個技能等級與興趣領域提供某物。挑選起始點並開始。

社群挑戰概觀

Beginner3 min readUpdated 2026-03-15

如何參與月度 AI 紅隊挑戰、賺取分數、分享結果，並與社群一同成長你之技能。

community challenges overview participation scoring

社群挑戰

為何參與

挑戰服務超越練習之數個目的：

技能驗證。 完成挑戰提供你能力之具體證據。每個挑戰具定義之評分準則使你可客觀量測你之進展。
技術發現。 於挑戰工作迫使你發展新穎途徑。領域中最有趣之技術某些已自 CTF 風格練習湧現。
社群學習。 於每個挑戰結束後，參與者分享其途徑。審查他人如何解決同一問題為擴展你技術劇目之最有效方式之一。
作品集打造。 已記錄之挑戰完成以認證單獨無法之方式對雇主與客戶展示實務技能。

挑戰如何運作

月度挑戰

新挑戰於每月之一日啟動。每個挑戰遵循此生命週期：

階段	時程	發生什麼
活躍	第 1-21 日	挑戰開放。獨立工作、經平台提交你之結果。於社群通道勿劇透。
討論	第 22-28 日	挑戰仍開放但允許討論。問問題、分享部分途徑、於卡住點協作。
審查	第 29 日-月底	解答與寫手被發布。為最佳寫手之社群投票。計分確定。

難度等級

挑戰以難度等級標記以助你選擇適切目標：

等級	預期背景	時間承諾
初學者	完成本 wiki 之基礎章節	2-4 小時
中等	熟悉提示注入與基礎代理利用	4-8 小時
進階	多步攻擊、工具利用、RAG 投毒之經驗	8-16 小時
專家	專業紅隊經驗或同等深度	16-40 小時

計分系統

每個挑戰定義其自身計分準則，但一般框架一致：

分數類別

目標完成（0-60 分）。 你達成陳述目標嗎？部分完成獲部分信用。
技術品質（0-20 分）。 你之途徑多乾淨、可靠與良好理解？10 中 9 次運作之技術較 10 中 1 次運作者計分較高。
文件（0-10 分）。 你是否清楚撰寫你之途徑使他人可重現？良好文件含你選擇背後之推理，非僅最終 payload。
創新（0-10 分）。 你發現新穎事物嗎？此可為新技術、非預期互動，或已知方法之創意應用。

計分層

層	分數	重要性
白金	90-100	具新穎貢獻之卓越表現
金	75-89	展示紮實方法論之強表現
銀	50-74	具改善空間之勝任執行
銅	25-49	顯示基礎理解之部分完成
參與者	1-24	已嘗試挑戰並提交結果

提交結果

於你提交含什麼

每個提交應含：

執行摘要。 描述你達成什麼及你整體途徑之一段。
環境設置。 你使用何工具、模型與組態。他人應可重現你之設置。
攻擊敘事。 你途徑之逐步描述，含死胡同與轉向。旅程與目的地同等重要。
證據。 展示你結果之截圖、記錄、對話紀錄或其他產物。
Payload 與技術。 你使用之實際提示、腳本或工具，配為何它們運作之解釋。
習得教訓。 何使你驚訝？你將以不同方式做什麼？你學得什麼？

提交格式

提交被接受為具嵌入程式碼區塊之 Markdown 文件。使用以下範本結構：

# [Challenge Name] - Submission by [Your Handle]
 
## Executive Summary
[One paragraph overview]
 
## Environment
- Model(s) tested: [list]
- Tools used: [list]
- Platform/API version: [details]
 
## Approach
### Phase 1: [Name]
[Description, reasoning, results]
 
### Phase 2: [Name]
[Description, reasoning, results]
 
## Evidence
[Screenshots, logs, transcripts]
 
## Payloads
[Code blocks with your actual techniques]
 
## Lessons Learned
[Reflections]

分享結果與寫手

於審查階段後，參與者被鼓勵發布詳細寫手。最佳寫手分享這些品質：

關於失敗之誠實。 記錄何未運作常較記錄何運作更具教育性。納入你之死胡同。
推理之解釋。 勿僅顯示 payload —— 解釋你為何認為它們將運作、你使用何心智模型，與你如何迭代。
與替代之比較。 若你嘗試多個途徑，解釋你為何選擇你所選與替代如何比較。
可重現性。 讀取你寫手之人應可遵循你之步驟並獲類似結果。

社群投票

於審查階段期間，社群成員可於三個類別對提交投票：

最具教育性 —— 教導最多之寫手
最具創意 —— 最新穎或最非預期之途徑
最佳文件 —— 最清楚、最可重現之寫手

每個類別中之獲勝者接收獎勵分數並於排行榜獲認可。

排行榜與排名

社群排行榜跨挑戰追蹤累積表現：

分數跨月累積。一致性被獎勵 —— 定期參與較偶爾高分更快打造你之分數。
為每個難度等級存在分離排行榜，故初學者與初學者競爭。
季度排名每季重置，予新參與者新鮮開始。
所有時間排名持續並反映對社群之持續貢獻。

行為準則

額外規則：

於活躍階段勿劇透。 分享你之興奮，非你之解答。
尊重其他參與者。 於寫手之建設性回饋受歡迎；不屑或菁英評論不。
歸屬借用之技術。 若你之途徑建立於他人之已發表工作，引用之。
負責任地回報平台問題。 若你於挑戰基礎設施本身（非挑戰目標）找到錯誤，回報組織者而非利用之。

工具	目的	何處取得
curl 或 httpie	API 互動	系統套件管理器
Python 3.10+	腳本化與自動化	python.org
jq	JSON 解析	系統套件管理器
文字編輯器或 IDE	撰寫提交與腳本	你之偏好
Burp Suite Community	HTTP 流量分析（為基礎設施挑戰）	portswigger.net

挑戰特定工具

某些挑戰需額外工具。這些於每個挑戰頁面列出。常見加入含：

Jupyter notebook 為資料分析挑戰（事件回應、鑑識）
Docker 為提供本地環境之挑戰
PyTorch 或 transformers 為模型層級挑戰
nmap 為基礎設施偵察挑戰

API 金鑰與存取

常見問題

我可以使用自動化工具（腳本、fuzzer、LLM）解挑戰嗎？

我可以於月度挑戰與他人協作嗎？

月度挑戰於活躍階段（第 1-21 日）為獨立工作設計。於討論階段（第 22-28 日），協作被鼓勵。為 CTF，團隊參與被明確支援。

若我於挑戰平台本身找到漏洞呢？

經社群平台上之負責任揭露通道回報組織者。真實平台漏洞賺取獎勵分數與認可。勿利用平台錯誤以獲不公平優勢。

過去挑戰過期嗎？

否。過去挑戰無限期保持可存取。自過去挑戰之分數計入你之所有時間排名，但不計入該月排行榜。

我可以重試我已提交之挑戰嗎？

是。你之最高分數被保留。於研究其他參與者寫手後重試為優秀學習策略。

入門

選擇你之第一個挑戰。 若你為新，以當月挑戰開始或於你難度等級選過去挑戰。
設置你之環境。 每個挑戰頁面列出你需之工具與存取。
通過工作。 預算難度等級指示之時間。勿急。
寫之。 即便你未完成每個目標，記錄你嘗試與學得什麼。
提交並互動。 提交你之結果，然後參與討論與審查階段。

以下之月度挑戰、季度競賽與社群貢獻挑戰為每個技能等級與興趣領域提供某物。挑選起始點並開始。

社群挑戰概觀

Learning Path

Related articles

社群挑戰概觀

Learning Path

Related articles