# training-pipeline
29 artikelengetagd met “training-pipeline”
Geavanceerd oefenexamen
25-question practice exam covering advanced AI red team techniques: multimodal attacks, training pipeline exploitation, agentic system attacks, embedding manipulation, and fine-tuning security.
Oefenexamen 2: geavanceerde AI-beveiliging
25-question advanced practice exam covering multimodal attacks, training pipeline security, cloud AI security, forensics, and governance.
Beveiligingsbeoordeling van de trainingspijplijn
Test your advanced knowledge of training pipeline attacks including data poisoning, fine-tuning hijacking, RLHF manipulation, and backdoor implantation with 9 questions.
Geavanceerd assessment van de trainingspipeline
Advanced assessment on RLHF exploitation, DPO vulnerabilities, and federated learning attacks.
Studiegids beveiliging van de trainingspijplijn
Study guide for training pipeline security covering data poisoning, RLHF attacks, and supply chain threats.
Capstone: aanval en verdediging van de trainingspipeline
Attack a model training pipeline through data poisoning and backdoor insertion, then build defenses to detect and prevent these attacks.
Beveiliging van ML-CI/CD
Security overview of ML continuous integration and deployment pipelines: how ML CI/CD differs from traditional CI/CD, unique attack surfaces in training workflows, and the security implications of automated model building and deployment.
Checkpoint-manipulatieaanvallen (training pipeline)
Directe manipulatie van modelcheckpoints en opgeslagen gewichten om backdoors te injecteren of gedrag te wijzigen.
Aanvallen op de continue trainingspipeline
Continue-leer- en online-trainingspipelines exploiteren via manipulatie van streaming data.
Exploitatie van Curriculum Learning (Training Pipeline)
Curriculum learning en datavolgorde exploiteren om het effect van vergiftigde trainingsvoorbeelden te versterken.
Manipuleren van Curriculum Learning-schema's
Hoe tegenstanders curriculum learning exploiteren door datavolgorde, moeilijkheidsplanning en faseovergangen te manipuleren om kwetsbaarheden tijdens de training in te bedden.
Datavergiftiging op schaal
Technieken om trainingsdata op schaal te vergiftigen om modelgedrag over brede capaciteiten heen te beïnvloeden.
Aanvalsoppervlak van gedistribueerde training
Beveiligingsanalyse van gedistribueerde trainingssystemen, waaronder aanvallen op gradiëntaggregatie, exploitatie van Byzantijnse fouten, kwetsbaarheden in communicatiekanalen en dreigingen voor federated learning.
Beveiligingsimplicaties van DPO-training
Analyse van beveiligingskwetsbaarheden die worden geïntroduceerd door Direct Preference Optimization, waaronder preferentiemanipulatie, exploitatie van het impliciete beloningsmodel en degradatie van safety alignment.
DPO-trainingskwetsbaarheden
Beveiligingsanalyse van Direct Preference Optimization-training en de kwetsbaarheid ervan voor preferentievergiftiging.
Manipuleren van evaluatiebenchmarks
Technieken om evaluatiebenchmarks te manipuleren om kwetsbaarheden te maskeren of veiligheidsscores op te blazen.
Aanvallen op Federated Learning (Training Pipeline)
Aanvallen op federated learning-opstellingen, waaronder modelvergiftiging, data-inferentie en manipulatie van aggregatie.
Gradiënt-gebaseerde aanvallen tijdens training
Technische diepgaande analyse van gradiënt-gebaseerde aanvalsmethoden die misbruik maken van toegang tijdens de training, waaronder gradiëntmanipulatie, adversariële gewichtsverstoring en het kapen van het trainingssignaal.
Aanvallen op de model-supply-chain
Uitgebreide analyse van aanvalsvectoren op de model-supply-chain, van trainingsdata tot en met deployment.
Aanvallen op pre-trainingdata
Het aanvallen van de pre-trainingdatapipeline, waaronder vergiftiging van webcrawls en manipulatie van datacuratie.
Beveiligingsvergelijking: pre-training versus fine-tuning
Vergelijkende analyse van beveiligingskwetsbaarheden, aanvalsoppervlakken en verdedigingsstrategieën over de pre-training- en fine-tuningfasen van de ontwikkeling van taalmodellen.
Uitbuiting van de RLHF-pipeline
Het uitbuiten van de training van reward-modellen, het verzamelen van voorkeursdata en de optimalisatielussen van RLHF.
Beveiliging van RLHF: Reward Hacking en aanvallen op het reward-model
Uitgebreide analyse van beveiligingskwetsbaarheden in RLHF-pipelines, waaronder reward hacking, vergiftiging van het reward-model en aanvallen via preferentiemanipulatie.
Aanvallen op de synthetische-datapipeline (Training Pipeline)
Het aanvallen van pipelines voor het genereren van synthetische data die worden gebruikt voor modeltraining en -augmentatie.
Vergiftigingsaanvallen op synthetische trainingsdata
Uitgebreide analyse van vergiftigingsvectoren in pipelines voor het genereren van synthetische data, van manipulatie van het teacher-model tot het ontwijken van filtering na generatie.
Beveiliging van trainingscheckpoints
Dreigingsanalyse van de opslag, serialisatie en herstel van modelcheckpoints, waaronder checkpointvergiftiging, deserialisatie-aanvallen en integriteitsverificatie.
Beveiliging van methoden voor attributie van trainingsdata
Analyse van kwetsbaarheden in technieken voor attributie van trainingsdata, waaronder influence functions, membership inference en het traceren van dataherkomst, met implicaties voor privacy en beveiliging.
Beveiligingsimplicaties van deduplicatie van trainingsdata
Analysis of how deduplication algorithms create security vulnerabilities, including adversarial deduplication evasion, strategic duplicate injection, and hash collision attacks.
Aanvallen op de trainingsinfrastructuur
Attacking training infrastructure including GPU clusters, distributed training, and orchestration systems.