# extraction

case-studiestraining-dataextractionprivacy

Case Study: Training Data Extraction from GPT

Analysis of the Carlini et al. work on extracting training data from ChatGPT in production.

code-gen-securityprompt-leakingextractionreverse-engineering

Prompt Extraction from Code Generation Tools

Techniques for extracting system prompts, custom instructions, and proprietary configurations from AI code generation tools.

training-dataextractionmemorizationcode-modelsintellectual-property

Training Data Extraction from Code Models

Techniques for recovering proprietary code from code generation model weights — covering memorization detection, targeted extraction, membership inference, and defensive countermeasures.

challengesystem-promptextractionprompt-injectionjanuary-2026

January 2026: System Prompt Extraction Challenge

Extract system prompts from five increasingly defended chatbots, progressing from unprotected to heavily hardened configurations.

data-trainingdistillationtransferextraction

Knowledge Distillation Attacks

Attacking knowledge distillation pipelines to transfer backdoors from teacher to student models or extract proprietary capabilities.

data-trainingmemorizationextractionprivacy

Model Memorization Patterns

Understanding when and why language models memorize training data, and techniques for detecting and exploiting memorization behavior.

piiextractionprivacydata-leakage

PII Extraction Techniques

Techniques for extracting personally identifiable information from trained language models including prompt-based extraction, prefix attacks, targeted queries, and real-world examples.

data-trainingextractiontraining-dataadvanced

Advanced Training Data Extraction

Advanced techniques for extracting memorized training data from language models.

embeddingextractionmodel-theftAPI

Embedding Extraction Techniques

Methods for extracting embedding model weights and behavior through API access, including dimension reduction and reconstruction attacks.

labssafety-classifierextractionadvanced

Lab: Safety Classifier Model Extraction

Extract the decision boundary of safety classifiers through systematic probing to craft maximally evasive payloads.

labtraining-dataextractionprivacy

Lab: Training Data Extraction at Scale

Extract memorized training data from language models using prefix-based extraction, divergence testing, and membership inference. Measure extraction rates and assess privacy risks.

labstraining-dataextractionproductionadvanced

Training Data Extraction from Production LLMs

Implement Carlini et al.'s techniques to extract memorized training data from production language model APIs.

labprompt-leakingsystem-promptextractionbeginnerhands-on

Lab: Prompt Leaking Basics

Learn to extract system prompts from chatbots using common leaking techniques including direct requests, indirect elicitation, and format manipulation.

labssystem-promptextractionbeginner

System Prompt Extraction Fundamentals

Learn to extract hidden system prompts from LLM applications using direct and indirect techniques.

labsystem-promptextractionreconnaissance

Lab: System Prompt Extraction

Hands-on techniques for extracting hidden system prompts from LLM-powered applications using direct asking, role-play, instruction replay, and other methods.

labsystem-promptreconnaissanceextractionbeginner

Lab: System Prompt Reconstruction

Use various techniques to systematically extract and reconstruct the full system prompt of an LLM application, combining direct, indirect, and incremental extraction methods.

labsctfsystem-promptextraction

Context Heist: System Prompt Extraction Championship

Extract system prompts from 10 progressively harder LLM applications using diverse techniques.

guardrailruleintermediatelablabsextraction

Guardrail Rule Extraction Lab

Systematically extract the rules and decision boundaries of guardrail systems through targeted probing.

prompt-injectionsystem-promptextractiontheft

System Prompt Theft Techniques

Comprehensive techniques for extracting hidden system prompts from production LLM applications, from simple direct requests to sophisticated indirect methods.

system-promptextractionrecontradecraftprompt-leaking

System Prompt Extraction

Techniques for extracting hidden system prompts from AI applications, revealing safety rules, tool definitions, behavioral constraints, and sensitive configuration.

system-promptextractionprompt-injectionautomationdetectiontradecraft

System Prompt Extraction Techniques

Catalog of system prompt extraction methods against LLM-powered applications: direct attacks, indirect techniques, multi-turn strategies, and defensive evasion.

Expert

Stealth Data Extraction Techniques

Stealthy techniques for extracting sensitive data from AI systems without triggering alerts.

tradecraftstealthextractionexfiltration

walkthroughsprompt-leakingadvancedextraction

Advanced Prompt Leaking Walkthrough

Advanced techniques for extracting system prompts including iterative reconstruction and side-channel methods.

prompt-injectionprompt-leakingsystem-promptextractionred-teamingbeginner

Prompt Leaking Step by Step

Systematic approaches to extract system prompts from LLM applications, covering direct elicitation, indirect inference, differential analysis, and output-based reconstruction.

assessmentprompt-leakageextraction

Prompt Leakage 評量

評量 of system prompt extraction techniques including direct probing, logprob analysis, and side-channel methods.

case-studiestraining-dataextractionprivacy

Case Study: 訓練 Data Extraction from GPT

Analysis of the Carlini et al. work on extracting training data from ChatGPT in production.

code-gen-securityprompt-leakingextractionreverse-engineering

Prompt Extraction from Code Generation 工具s

Techniques for extracting system prompts, custom instructions, and proprietary configurations from AI code generation tools.

training-dataextractionmemorizationcode-modelsintellectual-property

從程式碼模型萃取訓練資料

從程式碼生成模型權重復原專有程式碼的技術——涵蓋記憶偵測、針對性萃取、成員推論與防禦對策。

challengesystem-promptextractionprompt-injectionjanuary-2026

January 2026: System Prompt Extraction Challenge

Extract system prompts from five increasingly defended chatbots, progressing from unprotected to heavily hardened configurations.

data-trainingdistillationtransferextraction

Knowledge Distillation 攻擊s

攻擊ing knowledge distillation pipelines to transfer backdoors from teacher to student models or extract proprietary capabilities.

data-trainingmemorizationextractionprivacy

模型 Memorization Patterns

Understanding when and why language models memorize training data, and techniques for detecting and exploiting memorization behavior.

piiextractionprivacydata-leakage

PII Extraction Techniques

Techniques for extracting personally identifiable information from trained language models including prompt-based extraction, prefix attacks, targeted queries, and real-world examples.

data-trainingextractiontraining-dataadvanced

進階訓練 Data Extraction

進階 techniques for extracting memorized training data from language models.

embeddingextractionmodel-theftAPI

Embedding Extraction Techniques

Methods for extracting embedding model weights and behavior through API access, including dimension reduction and reconstruction attacks.

labssafety-classifierextractionadvanced

實驗室: Safety Classifier 模型 Extraction

Extract the decision boundary of safety classifiers through systematic probing to craft maximally evasive payloads.

labtraining-dataextractionprivacy

實驗室: 訓練 Data Extraction at Scale

Extract memorized training data from language models using prefix-based extraction, divergence testing, and membership inference. Measure extraction rates and assess privacy risks.

labstraining-dataextractionproductionadvanced

訓練 Data Extraction from Production LLMs

Implement Carlini et al.'s techniques to extract memorized training data from production language model APIs.

labprompt-leakingsystem-promptextractionbeginnerhands-on

實驗室: Prompt Leaking Basics

Learn to extract system prompts from chatbots using common leaking techniques including direct requests, indirect elicitation, and format manipulation.

labssystem-promptextractionbeginner

System Prompt Extraction 基礎

Learn to extract hidden system prompts from LLM applications using direct and indirect techniques.

labsystem-promptextractionreconnaissance

實驗室: System Prompt Extraction

Hands-on techniques for extracting hidden system prompts from LLM-powered applications using direct asking, role-play, instruction replay, and other methods.

labsystem-promptreconnaissanceextractionbeginner

實驗室: System Prompt Reconstruction

Use various techniques to systematically extract and reconstruct the full system prompt of an LLM application, combining direct, indirect, and incremental extraction methods.

labsctfsystem-promptextraction

Context Heist: System Prompt Extraction Championship

Extract system prompts from 10 progressively harder LLM applications using diverse techniques.

guardrailruleintermediatelablabsextraction

Guardrail Rule Extraction 實驗室

Systematically extract the rules and decision boundaries of guardrail systems through targeted probing.

prompt-injectionsystem-promptextractiontheft

System Prompt Theft Techniques

Comprehensive techniques for extracting hidden system prompts from production LLM applications, from simple direct requests to sophisticated indirect methods.

system-promptextractionrecontradecraftprompt-leaking

系統提示擷取

從 AI 應用中擷取隱藏系統提示的技術，揭露安全規則、工具定義、行為約束與敏感組態。

system-promptextractionprompt-injectionautomationdetectiontradecraft

系統提示擷取技術

針對 LLM 應用之系統提示擷取方法的目錄：直接攻擊、間接技術、多輪策略與規避偵測。

Expert

Stealth Data Extraction Techniques

Stealthy techniques for extracting sensitive data from AI systems without triggering alerts.

tradecraftstealthextractionexfiltration

walkthroughsprompt-leakingadvancedextraction

進階 Prompt Leaking 導覽

進階 techniques for extracting system prompts including iterative reconstruction and side-channel methods.

prompt-injectionprompt-leakingsystem-promptextractionred-teamingbeginner

Prompt Leaking Step by Step

Systematic approaches to extract system prompts from LLM applications, covering direct elicitation, indirect inference, differential analysis, and output-based reconstruction.