# techniques
標記為「techniques」的 20 篇文章
AI 威脅獵捕技術
用於識別針對 AI 系統進行中攻擊的主動威脅獵捕技術。
攻擊歸因技術
將 AI 攻擊歸因至特定行為者的技術,包括行為分析、基礎設施追蹤與技術指紋。
LLM 日誌分析技術
分析 LLM 應用程式日誌以識別攻擊模式與被妥協會話的技術。
程式助理利用技術
利用 AI 程式助理生成不安全程式碼或外洩儲存庫資訊的技術。
2026 年 2 月:越獄創新挑戰
開發針對強化語言模型的新穎越獄技巧,並以可再現性證據撰寫文件。評審依據新穎度、可靠度與可轉移性。
嵌入投毒技術
透過對訓練資料或嵌入空間投毒,扭曲向量表徵的技術。
LoRA 攻擊技術
利用 Low-Rank Adaptation 微調進行安全對齊移除與後門植入。
實作:注入技術概覽
Survey and test ten fundamental 提示詞注入 技術 against a local LLM, measuring effectiveness and cataloging behavioral patterns for each approach.
Lab: Basic Jailbreak Techniques
Hands-on exploration of 越獄 技術 including role-play, DAN-style prompts, and academic framing against multiple models.
Lab: Simple Payload Encoding Techniques
Practice encoding injection payloads using Base64, hex, URL encoding, and Unicode to bypass basic input filters.
實驗:防護欄繞過技術實驗室
針對 NeMo Guardrails、LLM Guard 與自製分類器防禦,練習防護欄繞過技術。
提示詞 Leakage Technique 實驗室
Practice multiple 系統提示詞 extraction techniques與measure their effectiveness across different targets.
影像注入技術
在影像中嵌入隱形或半隱形指令,使視覺語言模型誤將其視為合法提示詞。
多模態防禦繞過
繞過多模態 AI 系統所部署之安全過濾器與內容審核的技術。
競賽風格注入技術
AI 紅隊競賽與 CTF 挑戰中常用的注入技術。
越獄技術目錄
越獄技術綜合目錄,含效果評級、模型相容備註,以及演化歷史。
提示詞注入備忘錄
按類別組織的提示詞注入技術快速參考,每種技術附有範例載荷與防禦考量。
規避 AI 分類器的技術
規避 LLM 應用中輸入/輸出安全分類器的進階技術。
攻擊執行工作流程
執行 AI 紅隊攻擊之逐步工作流程:自偵察發現選擇技術、打造攻擊鏈、即時記錄發現、管理證據,與知曉何時升級或停止。
運用 MITRE ATLAS 進行 AI 攻擊對應
將 AI 紅隊演練的活動與發現對應至 MITRE ATLAS 框架的實作詳解,涵蓋戰術與技術辨識、攻擊鏈建構以及 Navigator 視覺化。