What is AI 地景：紅隊員地圖?

主要模型、提供者、部署模式，與自硬體至應用之 AI 堆疊——為當前 AI 生態系中之紅隊員定向。

What is AI 安全方法論?

AI 安全評估的結構化方法論——涵蓋威脅建模、攻擊面描繪、風險評估與報告框架。

What is 大型語言模型如何運作?

從安全視角理解大型語言模型——涵蓋 transformer 架構、分詞、注意力、訓練流程與安全對齊機制。

What is 對抗式 ML：核心概念?

對抗式機器學習的歷史與基本原理——擾動攻擊、逃避與投毒、穩健性——將古典對抗式 ML 銜接至 LLM 特有攻擊。

What is 紅隊視角的 AI 系統架構?

AI 系統如何於生產環境部署——模型 API、提示範本、編排、工具、記憶體與防護機制——並於每一層進行攻擊面分析。

What is 給紅隊員的嵌入向量與向量空間?

理解嵌入向量如何編碼語意意義、向量運算如何運作，以及為何紅隊員需要理解嵌入空間以進行 RAG 攻擊與相似性利用。

What is LLM 安全 Threat 模型?

Comprehensive threat model for LLM-powered applications covering all attack surfaces and threat actors.

What is Tokenization and Its 安全 Implications?

How tokenization works and why it creates security-relevant behaviors in language models.

What is Attention Mechanisms and 安全?

How attention mechanisms work and their role in enabling prompt injection attacks.

What is RLHF and Safety Alignment?

Understanding RLHF safety training and why it creates a bypassable rather than fundamental safety layer.

基礎

Beginner1 min readUpdated 2026-03-15

AI 紅隊演練的核心建構區塊，涵蓋紅隊方法論、AI 景觀、大型語言模型如何運作、嵌入向量與向量系統、AI 系統架構，以及對抗性機器學習概念。

foundations llms methodology embeddings architecture adversarial-ml

在能夠有效攻擊 AI 系統之前，您必須先理解它的運作方式。本節提供支撐整份課程中每個主題的技術與方法論基礎。無論您是傳統安全背景、需要學習 transformer 如何處理語言，或是 ML 背景、需要學習結構化的安全評估方法論，這些基礎都將填補您的知識落差。

此處的材料刻意以實務為主。與其窮究 ML 理論，我們聚焦於那些會產生與安全相關行為的 AI 系統面向：分詞如何影響注入攻擊、注意力機制如何被利用、嵌入空間如何使語意操控成為可能，以及部署架構如何劃出信任邊界。每個概念都以「紅隊員為把工作做好所必須知道的」視角呈現。

知識堆疊

AI 紅隊演練位於機器學習、軟體安全與對抗性思維的交會處。基礎章節由下而上組織，循序建立理解。

方法論 確立 AI 安全評估的結構化方法。包含將漏洞依類型與影響分類的攻擊分類、為 AI 系統調整的威脅建模框架，以及界定負責任紅隊演練的倫理與法律護欄。沒有方法論，測試將淪為零散——可能找到個別漏洞，卻漏掉系統性弱點。

AI 景觀 提供對更廣大生態系的定位。理解開放模型與封閉模型的差異、主要 API 供應商及其安全模型、從邊緣到雲端的部署模式，以及生產環境中的各種模型類型，能讓您在界定工作範圍與識別實際測試對象時有足夠背景。

大型語言模型如何運作 涵蓋驅動安全相關行為的技術內部原理。Transformer 架構說明注意力機制如何在符元間路由資訊；分詞揭示為何某些編碼技巧能繞過過濾器；訓練管線的理解則說明安全行為在何處被注入、又如何被削弱；推論與解碼機制則解釋溫度、抽樣與 logit 處理為何會影響攻擊成功率。

嵌入向量與向量系統 是理解 RAG 架構與語意相似度的關鍵。一旦您知道文件如何被嵌入向量空間並依相似度檢索，就能推論如何操控檢索、投毒知識庫，並利用語意相似度與語意意圖之間的落差。

AI 系統架構 描繪生產環境 AI 部署的元件：API 層、編排框架、工具整合、代理模式，以及它們之間的信任邊界。這種架構層級的理解，能讓您辨識出光看使用者介面無法看見的攻擊面。

對抗性機器學習概念 將傳統對抗性機器學習與現代大型語言模型安全銜接起來。來自學術對抗性 ML 文獻的梯度攻擊、威脅模型與穩健性概念，為許多對已部署系統的實務攻擊提供了理論基礎。

本節您將學到

紅隊方法論 ——AI 安全評估的結構化方法，包含攻擊分類、威脅建模基礎、倫理守則與法律考量
AI 景觀 ——模型類型、部署模式、API 生態系，以及開放／封閉模型的差異概覽
大型語言模型如何運作 ——Transformer 架構、分詞與其安全意涵、從預訓練到對齊的訓練管線、推論與解碼機制，以及尺度化與湧現
嵌入向量與向量系統 ——嵌入如何編碼意義、語意相似度及其操控，以及 RAG 架構與檢索機制
AI 系統架構 ——部署模式、API 解剖、代理架構，以及界定攻擊面的信任邊界
對抗性機器學習概念 ——ML 系統的威脅模型、梯度攻擊，以及形塑現代 AI 安全的穩健性概念

先備知識

本節設計為整份課程的起點。不需任何 AI 或 ML 先備經驗，但下列背景能讓您更快掌握教材：

程式設計基礎 ——能閱讀 Python 程式碼並理解 API 互動
基本安全概念 ——熟悉漏洞類別、威脅建模與傳統資安中的攻擊者思維
一般技術素養 ——理解 HTTP、JSON、REST API 與主從式架構

基礎

Beginner1 min readUpdated 2026-03-15

AI 紅隊演練的核心建構區塊，涵蓋紅隊方法論、AI 景觀、大型語言模型如何運作、嵌入向量與向量系統、AI 系統架構，以及對抗性機器學習概念。

foundations llms methodology embeddings architecture adversarial-ml

知識堆疊

AI 紅隊演練位於機器學習、軟體安全與對抗性思維的交會處。基礎章節由下而上組織，循序建立理解。

本節您將學到

紅隊方法論 ——AI 安全評估的結構化方法，包含攻擊分類、威脅建模基礎、倫理守則與法律考量
AI 景觀 ——模型類型、部署模式、API 生態系，以及開放／封閉模型的差異概覽
大型語言模型如何運作 ——Transformer 架構、分詞與其安全意涵、從預訓練到對齊的訓練管線、推論與解碼機制，以及尺度化與湧現
嵌入向量與向量系統 ——嵌入如何編碼意義、語意相似度及其操控，以及 RAG 架構與檢索機制
AI 系統架構 ——部署模式、API 解剖、代理架構，以及界定攻擊面的信任邊界
對抗性機器學習概念 ——ML 系統的威脅模型、梯度攻擊，以及形塑現代 AI 安全的穩健性概念

先備知識

本節設計為整份課程的起點。不需任何 AI 或 ML 先備經驗，但下列背景能讓您更快掌握教材：

程式設計基礎 ——能閱讀 Python 程式碼並理解 API 互動
基本安全概念 ——熟悉漏洞類別、威脅建模與傳統資安中的攻擊者思維
一般技術素養 ——理解 HTTP、JSON、REST API 與主從式架構

基礎

知識堆疊

本節您將學到

先備知識

Learning Path

基礎

知識堆疊

本節您將學到

先備知識

Learning Path

基礎

知識堆疊

本節您將學到

先備知識

Learning Path

Related articles

基礎

知識堆疊

本節您將學到

先備知識

Learning Path

Related articles