# training-data

15 artikelengetagd met “training-data”

Forensics van datalekken in trainingsdata

Het onderzoeken van datalekken in trainingsdata, inclusief bewijs van data-extractie en indicatoren voor membership inference.

ai-forensicstraining-databreachforensics

Gevorderd

Forensics van trainingsdata-herkomst

Forensische technieken voor het traceren van de oorsprong, herkomst en integriteit van trainingsdata die in machine learning-modellen worden gebruikt.

ai-forensics-irdata-provenancetraining-datasupply-chain

Gemiddeld

Casestudy: extractie van trainingsdata uit GPT

Analysis of the Carlini et al. work on extracting training data from ChatGPT in production.

case-studiestraining-dataextractionprivacy

Gevorderd

Poisoning van codesuggesties

Overview of attacks that manipulate AI coding assistant suggestions through training data poisoning and inference-time context manipulation.

suggestion-poisoningtraining-datacontext-manipulationsupply-chaincode-generation

Gemiddeld

Extractie van trainingsdata uit codemodellen

Techniques for recovering proprietary code from code generation model weights — covering memorization detection, targeted extraction, membership inference, and defensive countermeasures.

training-dataextractionmemorizationcode-modelsintellectual-property

Gevorderd

Geavanceerde modelinversie-aanvallen

Reconstructing training data from model weights and API access using gradient-based inversion, generative model-assisted reconstruction, and membership inference refinement.

model-inversiontraining-datareconstructionprivacygradient-inversion

Gevorderd

Geavanceerde extractie van trainingsdata

Advanced techniques for extracting memorized training data from language models.

data-trainingextractiontraining-dataadvanced

Gevorderd

Membership inference via embeddings

Bepalen of specifieke data in de trainingsset van een embeddingmodel zat via afstandsgebaseerde inferentie, statistische toetsen en analyse van embedding-gedrag.

membership-inferenceprivacytraining-datastatistical-testsembedding-analysis

Gevorderd

Repository-Vergiftiging voor Codemodellen

Technieken voor het vergiftigen van code-repositories om codegeneratiemodellen te beïnvloeden, waaronder vergiftiging van trainingsdata via populaire repositories, injectie van backdoors in open-source dependencies, en supply chain-aanvallen gericht op trainingspijplijnen van codemodellen.

repository-poisoningcode-modelssupply-chaintraining-databackdoorsopen-source

Gevorderd

Opslagsystemen voor trainingsdata beveiligen

Aanvals- en verdedigingsstrategieën voor S3, GCS, HDFS en objectopslagsystemen die AI-trainingsdatasets en modelartefacten bevatten

infrastructurestorage-securitys3gcshdfsdata-securitytraining-data

Gemiddeld

Lab: extractie van trainingsdata op schaal

Extract memorized training data from language models using prefix-based extraction, divergence testing, and membership inference. Measure extraction rates and assess privacy risks.

labtraining-dataextractionprivacy

Gevorderd

Extractie van trainingsdata uit productie-LLM's

Implement Carlini et al.'s techniques to extract memorized training data from production language model APIs.

labstraining-dataextractionproductionadvanced

Gevorderd

Trainingsdata extraheren

Technieken om gememoriseerde trainingsdata, system prompts en privé-informatie uit LLM's te extraheren via gerichte queries en membership inference-aanvallen.

data-extractiontraining-dataprivacymembership-inferencemodel-extraction

Gevorderd

RAG-, data- en trainingsaanvallen

Overzicht van aanvallen gericht op de datalaag van AI-systemen, waaronder RAG-poisoning, manipulatie van trainingsdata en data-extractietechnieken.

ragdata-poisoningtraining-datadata-extractionai-security

Beginner

Manipulatie van trainingsdata

Aanvallen die het modelgedrag corrumperen door trainingsdata, fine-tuning-datasets of RLHF-voorkeursdata te vergiftigen, waaronder het installeren van backdoors en het verwijderen van safety alignment.

training-datadata-poisoningbackdoorsfine-tuningalignment

Gevorderd