# training-pipeline

practice-examadvancedmultimodaltraining-pipelinecloud-aiforensicsgovernance

Practice Exam 2: Advanced AI Security

25-question advanced practice exam covering multimodal attacks, training pipeline security, cloud AI security, forensics, and governance.

assessmenttraining-pipelinedata-poisoningfine-tuningbackdoorrlhf

Training Pipeline Security Assessment

Test your advanced knowledge of training pipeline attacks including data poisoning, fine-tuning hijacking, RLHF manipulation, and backdoor implantation with 9 questions.

assessmentstraining-pipelineadvancedexam

Advanced Training Pipeline Assessment

Advanced assessment on RLHF exploitation, DPO vulnerabilities, and federated learning attacks.

assessmentsstudy-guidetraining-pipelineprep

Training Pipeline Security Study Guide

Study guide for training pipeline security covering data poisoning, RLHF attacks, and supply chain threats.

capstonetraining-pipelinedata-poisoningbackdooradvanced

Capstone: Training Pipeline Attack & Defense

Attack a model training pipeline through data poisoning and backdoor insertion, then build defenses to detect and prevent these attacks.

ml-cicdpipeline-securitytraining-pipelinedeploymentautomationdevops

ML CI/CD Security

Security overview of ML continuous integration and deployment pipelines: how ML CI/CD differs from traditional CI/CD, unique attack surfaces in training workflows, and the security implications of automated model building and deployment.

training-pipelinecheckpointmanipulationweights

Checkpoint Manipulation Attacks (Training Pipeline)

Direct manipulation of model checkpoints and saved weights to inject backdoors or alter behavior.

training-pipelinecontinuous-trainingpipelineattacks

Continuous Training Pipeline Attacks

Exploiting continuous learning and online training pipelines through streaming data manipulation.

training-pipelinecurriculum-learningexploitationordering

Curriculum Learning Exploitation (Training Pipeline)

Exploiting curriculum learning and data ordering to amplify the effect of poisoned training examples.

training-pipelinecurriculum-learningdata-orderingtraining-manipulation

Manipulating Curriculum Learning Schedules

How adversaries exploit curriculum learning by manipulating data ordering, difficulty scheduling, and stage transitions to embed vulnerabilities during training.

training-pipelinedata-poisoningscaleattacks

Data Poisoning at Scale

Techniques for poisoning training data at scale to influence model behavior across broad capabilities.

training-pipelinedistributed-traininginfrastructure-securitybyzantine-faults

Attack Surface of Distributed Training

Security analysis of distributed training systems including gradient aggregation attacks, Byzantine fault exploitation, communication channel vulnerabilities, and federated learning threats.

training-pipelinedpoalignmentsafetypreference-learning

Security Implications of DPO Training

Analysis of security vulnerabilities introduced by Direct Preference Optimization, including preference manipulation, implicit reward model exploitation, and safety alignment degradation.

training-pipelinedpotrainingvulnerabilities

DPO Training Vulnerabilities

Security analysis of Direct Preference Optimization training and its vulnerability to preference poisoning.

training-pipelinebenchmarksgamingevaluation

Evaluation Benchmark Gaming

Techniques for gaming evaluation benchmarks to mask vulnerabilities or inflate safety scores.

training-pipelinefederated-learningattacksdistributed

Federated Learning Attacks (Training Pipeline)

Attacks on federated learning setups including model poisoning, data inference, and aggregation manipulation.

training-pipelinegradientsadversarial-attackstraining-security

Gradient-Based Attacks During Training

Technical deep dive into gradient-based attack methods that exploit training-time access, including gradient manipulation, adversarial weight perturbation, and training signal hijacking.

training-pipelinesupply-chainmodelattacks

Model Supply Chain Attacks

Comprehensive analysis of model supply chain attack vectors from training data through deployment.

training-pipelinepre-trainingdataattacks

Pre-Training Data Attacks

Attacking the pre-training data pipeline including web crawl poisoning and data curation manipulation.

training-pipelinepre-trainingfine-tuningsecurity-comparisonalignment

Security Comparison: Pre-training vs Fine-tuning

Comparative analysis of security vulnerabilities, attack surfaces, and defensive strategies across pre-training and fine-tuning phases of language model development.

training-pipelinerlhfpipelineexploitation

RLHF Pipeline Exploitation

Exploiting reward model training, preference data collection, and RLHF optimization loops.

training-pipelinerlhfreward-hackingreward-modelsecurity

Security of RLHF: Reward Hacking and Reward Model Attacks

Comprehensive analysis of security vulnerabilities in RLHF pipelines, including reward hacking, reward model poisoning, and preference manipulation attacks.

training-pipelinesynthetic-datapipelineattacks

Synthetic Data Pipeline Attacks (Training Pipeline)

Attacking synthetic data generation pipelines used for model training and augmentation.

training-pipelinesynthetic-datadata-poisoningsupply-chain

Poisoning Attacks on Synthetic Training Data

Comprehensive analysis of poisoning vectors in synthetic data generation pipelines, from teacher model manipulation to post-generation filtering evasion.

training-pipelinecheckpointsmodel-securitysupply-chain

Security of Training Checkpoints

Threat analysis of model checkpoint storage, serialization, and restoration including checkpoint poisoning, deserialization attacks, and integrity verification.

training-pipelinedata-attributioninfluence-functionsmembership-inferenceprivacy

Security of Training Data Attribution Methods

Analysis of vulnerabilities in training data attribution techniques including influence functions, membership inference, and data provenance tracking, with implications for privacy and security.

training-pipelinededuplicationdata-securitypreprocessing

Security Implications of Training Data Deduplication

Analysis of how deduplication algorithms create security vulnerabilities, including adversarial deduplication evasion, strategic duplicate injection, and hash collision attacks.

training-pipelineinfrastructureattackscompute

Training Infrastructure Attacks

Attacking training infrastructure including GPU clusters, distributed training, and orchestration systems.

practice-examadvancedmultimodaltraining-pipelineagenticfine-tuning

進階 Practice Exam

25-question practice exam covering advanced AI red team techniques: multimodal attacks, training pipeline exploitation, agentic system attacks, embedding manipulation, and fine-tuning security.

practice-examadvancedmultimodaltraining-pipelinecloud-aiforensicsgovernance

Practice Exam 2: 進階 AI 安全

25-question advanced practice exam covering multimodal attacks, training pipeline security, cloud AI security, forensics, and governance.

assessmenttraining-pipelinedata-poisoningrlhfevaluation

章節評量：訓練管線

15 題校準評量，測試你對訓練管線安全的理解——資料投毒、RLHF 操控與架構層級攻擊。

assessmentstraining-pipelineadvancedexam

進階訓練 Pipeline 評量

進階 assessment on RLHF exploitation, DPO vulnerabilities, and federated learning attacks.

assessmentsstudy-guidetraining-pipelineprep

訓練 Pipeline 安全 Study 指南

Study guide for training pipeline security covering data poisoning, RLHF attacks, and supply chain threats.

capstonetraining-pipelinedata-poisoningbackdooradvanced

Capstone: 訓練 Pipeline 攻擊 & 防禦

攻擊 a model training pipeline through data poisoning and backdoor insertion, then build defenses to detect and prevent these attacks.

ml-cicdpipeline-securitytraining-pipelinedeploymentautomationdevops

ML CI/CD 安全

ML 持續整合與部署管線的安全概觀：ML CI/CD 與傳統 CI/CD 的差異、訓練工作流程中的獨特攻擊面，以及自動化模型建構與部署的安全意涵。

training-pipelinecheckpointmanipulationweights

Checkpoint Manipulation 攻擊s (訓練 Pipeline)

Direct manipulation of model checkpoints and saved weights to inject backdoors or alter behavior.

training-pipelinecontinuous-trainingpipelineattacks

Continuous 訓練 Pipeline 攻擊s

利用ing continuous learning and online training pipelines through streaming data manipulation.

training-pipelinecurriculum-learningexploitationordering

Curriculum Learning 利用ation (訓練 Pipeline)

利用ing curriculum learning and data ordering to amplify the effect of poisoned training examples.

training-pipelinecurriculum-learningdata-orderingtraining-manipulation

Manipulating Curriculum Learning Schedules

How adversaries exploit curriculum learning by manipulating data ordering, difficulty scheduling, and stage transitions to embed vulnerabilities during training.

training-pipelinedata-poisoningscaleattacks

Data 投毒 at Scale

Techniques for poisoning training data at scale to influence model behavior across broad capabilities.

training-pipelinedistributed-traininginfrastructure-securitybyzantine-faults

攻擊 Surface of Distributed 訓練

安全 analysis of distributed training systems including gradient aggregation attacks, Byzantine fault exploitation, communication channel vulnerabilities, and federated learning threats.

training-pipelinedpoalignmentsafetypreference-learning

安全 Implications of DPO 訓練

Analysis of security vulnerabilities introduced by Direct Preference Optimization, including preference manipulation, implicit reward model exploitation, and safety alignment degradation.

training-pipelinedpotrainingvulnerabilities

DPO 訓練 Vulnerabilities

安全 analysis of Direct Preference Optimization training and its vulnerability to preference poisoning.

training-pipelinebenchmarksgamingevaluation

Evaluation Benchmark Gaming

Techniques for gaming evaluation benchmarks to mask vulnerabilities or inflate safety scores.

training-pipelinefederated-learningattacksdistributed

Federated Learning 攻擊s (訓練 Pipeline)

攻擊s on federated learning setups including model poisoning, data inference, and aggregation manipulation.

training-pipelinegradientsadversarial-attackstraining-security

Gradient-Based 攻擊s During 訓練

Technical deep dive into gradient-based attack methods that exploit training-time access, including gradient manipulation, adversarial weight perturbation, and training signal hijacking.

training-pipelinesupply-chainmodelattacks

模型 Supply Chain 攻擊s

Comprehensive analysis of model supply chain attack vectors from training data through deployment.

training-pipelinepre-trainingdataattacks

Pre-訓練 Data 攻擊s

攻擊ing the pre-training data pipeline including web crawl poisoning and data curation manipulation.

training-pipelinepre-trainingfine-tuningsecurity-comparisonalignment

安全 Comparison: Pre-training vs Fine-tuning

Comparative analysis of security vulnerabilities, attack surfaces, and defensive strategies across pre-training and fine-tuning phases of language model development.

training-pipelinerlhfpipelineexploitation

RLHF Pipeline 利用ation

利用ing reward model training, preference data collection, and RLHF optimization loops.

training-pipelinerlhfreward-hackingreward-modelsecurity

安全 of RLHF: Reward Hacking and Reward 模型攻擊s

Comprehensive analysis of security vulnerabilities in RLHF pipelines, including reward hacking, reward model poisoning, and preference manipulation attacks.

training-pipelinesynthetic-datapipelineattacks

Synthetic Data Pipeline 攻擊s (訓練 Pipeline)

攻擊ing synthetic data generation pipelines used for model training and augmentation.

training-pipelinesynthetic-datadata-poisoningsupply-chain

投毒攻擊s on Synthetic 訓練 Data

Comprehensive analysis of poisoning vectors in synthetic data generation pipelines, from teacher model manipulation to post-generation filtering evasion.

training-pipelinecheckpointsmodel-securitysupply-chain

安全 of 訓練 Checkpoints

Threat analysis of model checkpoint storage, serialization, and restoration including checkpoint poisoning, deserialization attacks, and integrity verification.

training-pipelinedata-attributioninfluence-functionsmembership-inferenceprivacy

安全 of 訓練 Data Attribution Methods

Analysis of vulnerabilities in training data attribution techniques including influence functions, membership inference, and data provenance tracking, with implications for privacy and security.

training-pipelinededuplicationdata-securitypreprocessing

安全 Implications of 訓練 Data Deduplication

Analysis of how deduplication algorithms create security vulnerabilities, including adversarial deduplication evasion, strategic duplicate injection, and hash collision attacks.

training-pipelineinfrastructureattackscompute

訓練 Infrastructure 攻擊s

攻擊ing training infrastructure including GPU clusters, distributed training, and orchestration systems.