# pre-training

5 articlestagged with “pre-training”

Training Pipeline Security

Security of the full AI model training pipeline, covering pre-training attacks, fine-tuning and alignment manipulation, architecture-level vulnerabilities, and advanced training-time threats.

trainingpre-trainingfine-tuningarchitecturedata-poisoningrlhfalignment

Beginner

Pre-training Attack Surface

Comprehensive overview of pre-training security vulnerabilities including data collection, cleaning, deduplication, and web-scale dataset compromise attack vectors.

pre-trainingattack-surfacedata-collectionweb-scrapingdataset-security

Advanced

Pre-Training Data Attacks

Attacking the pre-training data pipeline including web crawl poisoning and data curation manipulation.

training-pipelinepre-trainingdataattacks

Advanced

Pre-Training Safety Interventions

Analysis of safety interventions applied during pre-training including data filtering, loss weighting, and curriculum design.

trainingpre-trainingsafety

Advanced

Security Comparison: Pre-training vs Fine-tuning

Comparative analysis of security vulnerabilities, attack surfaces, and defensive strategies across pre-training and fine-tuning phases of language model development.

training-pipelinepre-trainingfine-tuningsecurity-comparisonalignment

Intermediate