基礎
AI 紅隊演練的核心建構區塊,涵蓋紅隊方法論、AI 景觀、大型語言模型如何運作、嵌入向量與向量系統、AI 系統架構,以及對抗性機器學習概念。
在能夠有效攻擊 AI 系統之前,您必須先理解它的運作方式。本節提供支撐整份課程中每個主題的技術與方法論基礎。無論您是傳統安全背景、需要學習 transformer 如何處理語言,或是 ML 背景、需要學習結構化的安全評估方法論,這些基礎都將填補您的知識落差。
此處的材料刻意以實務為主。與其窮究 ML 理論,我們聚焦於那些會產生與安全相關行為的 AI 系統面向:分詞如何影響注入攻擊、注意力機制如何被利用、嵌入空間如何使語意操控成為可能,以及部署架構如何劃出信任邊界。每個概念都以「紅隊員為把工作做好所必須知道的」視角呈現。
知識堆疊
AI 紅隊演練位於機器學習、軟體安全與對抗性思維的交會處。基礎章節由下而上組織,循序建立理解。
方法論 確立 AI 安全評估的結構化方法。包含將漏洞依類型與影響分類的攻擊分類、為 AI 系統調整的威脅建模框架,以及界定負責任紅隊演練的倫理與法律護欄。沒有方法論,測試將淪為零散——可能找到個別漏洞,卻漏掉系統性弱點。
AI 景觀 提供對更廣大生態系的定位。理解開放模型與封閉模型的差異、主要 API 供應商及其安全模型、從邊緣到雲端的部署模式,以及生產環境中的各種模型類型,能讓您在界定工作範圍與識別實際測試對象時有足夠背景。
大型語言模型如何運作 涵蓋驅動安全相關行為的技術內部原理。Transformer 架構說明注意力機制如何在符元間路由資訊;分詞揭示為何某些編碼技巧能繞過過濾器;訓練管線的理解則說明安全行為在何處被注入、又如何被削弱;推論與解碼機制則解釋溫度、抽樣與 logit 處理為何會影響攻擊成功率。
嵌入向量與向量系統 是理解 RAG 架構與語意相似度的關鍵。一旦您知道文件如何被嵌入向量空間並依相似度檢索,就能推論如何操控檢索、投毒知識庫,並利用語意相似度與語意意圖之間的落差。
AI 系統架構 描繪生產環境 AI 部署的元件:API 層、編排框架、工具整合、代理模式,以及它們之間的信任邊界。這種架構層級的理解,能讓您辨識出光看使用者介面無法看見的攻擊面。
對抗性機器學習概念 將傳統對抗性機器學習與現代大型語言模型安全銜接起來。來自學術對抗性 ML 文獻的梯度攻擊、威脅模型與穩健性概念,為許多對已部署系統的實務攻擊提供了理論基礎。
本節您將學到
- 紅隊方法論 ——AI 安全評估的結構化方法,包含攻擊分類、威脅建模基礎、倫理守則與法律考量
- AI 景觀 ——模型類型、部署模式、API 生態系,以及開放/封閉模型的差異概覽
- 大型語言模型如何運作 ——Transformer 架構、分詞與其安全意涵、從預訓練到對齊的訓練管線、推論與解碼機制,以及尺度化與湧現
- 嵌入向量與向量系統 ——嵌入如何編碼意義、語意相似度及其操控,以及 RAG 架構與檢索機制
- AI 系統架構 ——部署模式、API 解剖、代理架構,以及界定攻擊面的信任邊界
- 對抗性機器學習概念 ——ML 系統的威脅模型、梯度攻擊,以及形塑現代 AI 安全的穩健性概念
先備知識
本節設計為整份課程的起點。不需任何 AI 或 ML 先備經驗,但下列背景能讓您更快掌握教材:
- 程式設計基礎 ——能閱讀 Python 程式碼並理解 API 互動
- 基本安全概念 ——熟悉漏洞類別、威脅建模與傳統資安中的攻擊者思維
- 一般技術素養 ——理解 HTTP、JSON、REST API 與主從式架構