# training-data
15 artikelengetagd met “training-data”
Forensics van datalekken in trainingsdata
Het onderzoeken van datalekken in trainingsdata, inclusief bewijs van data-extractie en indicatoren voor membership inference.
Forensics van trainingsdata-herkomst
Forensische technieken voor het traceren van de oorsprong, herkomst en integriteit van trainingsdata die in machine learning-modellen worden gebruikt.
Casestudy: extractie van trainingsdata uit GPT
Analysis of the Carlini et al. work on extracting training data from ChatGPT in production.
Poisoning van codesuggesties
Overview of attacks that manipulate AI coding assistant suggestions through training data poisoning and inference-time context manipulation.
Extractie van trainingsdata uit codemodellen
Techniques for recovering proprietary code from code generation model weights — covering memorization detection, targeted extraction, membership inference, and defensive countermeasures.
Geavanceerde modelinversie-aanvallen
Reconstructing training data from model weights and API access using gradient-based inversion, generative model-assisted reconstruction, and membership inference refinement.
Geavanceerde extractie van trainingsdata
Advanced techniques for extracting memorized training data from language models.
Membership inference via embeddings
Bepalen of specifieke data in de trainingsset van een embeddingmodel zat via afstandsgebaseerde inferentie, statistische toetsen en analyse van embedding-gedrag.
Repository-Vergiftiging voor Codemodellen
Technieken voor het vergiftigen van code-repositories om codegeneratiemodellen te beïnvloeden, waaronder vergiftiging van trainingsdata via populaire repositories, injectie van backdoors in open-source dependencies, en supply chain-aanvallen gericht op trainingspijplijnen van codemodellen.
Opslagsystemen voor trainingsdata beveiligen
Aanvals- en verdedigingsstrategieën voor S3, GCS, HDFS en objectopslagsystemen die AI-trainingsdatasets en modelartefacten bevatten
Lab: extractie van trainingsdata op schaal
Extract memorized training data from language models using prefix-based extraction, divergence testing, and membership inference. Measure extraction rates and assess privacy risks.
Extractie van trainingsdata uit productie-LLM's
Implement Carlini et al.'s techniques to extract memorized training data from production language model APIs.
Trainingsdata extraheren
Technieken om gememoriseerde trainingsdata, system prompts en privé-informatie uit LLM's te extraheren via gerichte queries en membership inference-aanvallen.
RAG-, data- en trainingsaanvallen
Overzicht van aanvallen gericht op de datalaag van AI-systemen, waaronder RAG-poisoning, manipulatie van trainingsdata en data-extractietechnieken.
Manipulatie van trainingsdata
Aanvallen die het modelgedrag corrumperen door trainingsdata, fine-tuning-datasets of RLHF-voorkeursdata te vergiftigen, waaronder het installeren van backdoors en het verwijderen van safety alignment.