# privacy
44 artikelengetagd met “privacy”
Geheugenexfiltratie
Technieken voor het extraheren van data uit geheugensystemen van AI-agents, waaronder het extraheren van eerdere gesprekken, het onthullen van data van andere gebruikers en informatielekkage tussen sessies.
Onderzoek naar datalekken in AI-systemen
Het onderzoeken van datalekken waarbij AI-systemen betrokken zijn, waaronder blootstelling van trainingsdata, exploitatie van modelmemorisatie en embedding-inversieaanvallen.
Assessment van dataprivacy in AI
Assessment on training data privacy, membership inference, data extraction, and privacy-preserving techniques.
Beoordeling van embedding- en vectorbeveiliging (beoordeling)
Test your understanding of embedding inversion attacks, vector database security, similarity search manipulation, and privacy risks of stored embeddings with 10 questions.
Beoordeling van privacyaanvallen
Test your advanced knowledge of privacy attacks against AI systems including data leakage, PII extraction, differential privacy failures, and inference-time privacy risks with 9 questions.
Casestudy: het Samsung-datalek via ChatGPT
Analysis of the Samsung confidential code leak through ChatGPT and organizational AI policy implications.
Casestudy: extractie van trainingsdata uit GPT
Analysis of the Carlini et al. work on extracting training data from ChatGPT in production.
Bias en fouten bij gezichtsherkenning
Analysis of facial recognition AI incidents including racial and gender bias in commercial systems, wrongful arrests, privacy violations, and the security implications of adversarial attacks on biometric AI.
ChatGPT-datalek (maart 2023)
Analysis of the March 2023 ChatGPT incident where a Redis client library bug caused users to see other users' conversation titles, partial chat history, and payment information. Covers root cause, impact, and lessons for AI application security.
Dataset inference-aanvallen
Inferring properties of the training dataset through model behavior analysis.
Data- en trainingsbeveiliging
Security vulnerabilities in the AI data pipeline, covering RAG exploitation, training data attacks, model extraction and intellectual property theft, and privacy attacks against deployed models.
Verdedigingen tegen membership inference
Evaluating and implementing defenses against membership inference attacks that determine whether specific samples were in a model's training set.
Praktische membership inference-aanvallen
Practical guide to conducting membership inference attacks against deployed language models.
Modelinversie-aanvallen
Recovering sensitive training data features through model inversion techniques.
Memorisatiepatronen van modellen
Understanding when and why language models memorize training data, and techniques for detecting and exploiting memorization behavior.
Aanvallen op privacy en gegevensbescherming
Overview of privacy attacks against AI systems including data extraction, membership inference, and model inversion, with regulatory implications and red team methodology.
Membership inference-aanvallen
Techniques for determining whether specific data was used to train an AI model, including shadow model approaches, loss-based inference, LiRA, and practical implementation guidance.
Geavanceerde modelinversie-aanvallen
Reconstructing training data from model weights and API access using gradient-based inversion, generative model-assisted reconstruction, and membership inference refinement.
Modelinversie-aanvallen (data en training)
Techniques for reconstructing training data from model outputs including gradient-based inversion, generative model inversion, and privacy implications for image and language models.
Technieken voor PII-extractie
Techniques for extracting personally identifiable information from trained language models including prompt-based extraction, prefix attacks, targeted queries, and real-world examples.
Privacyaanvallen op embeddings
Recovering sensitive information from embedding vectors through inversion attacks, attribute inference, and reconstruction techniques.
Beveiligingsrisico's van synthetische data
Security implications of using synthetic data for model training, including inherited biases, poisoning propagation, and privacy leakage.
AI-loggingarchitectuur
Wat je vastlegt in de logs van AI-systemen — prompts, completions, latency, tokens, tool-aanroepen — samen met opslagstrategieën, bewaarbeleid en privacyoverwegingen.
Embedding-privacy
Wat embeddings onthullen over de brondata — over embedding-inversieaanvallen, membership inference, attribuutinferentie, privacybehoudende embeddingtechnieken en de implicaties voor regelgeving.
Aanvallen op embeddingniveau
Overzicht van aanvallen die zich rechtstreeks op embeddings richten: het genereren van adversariële embeddings, inversie-aanvallen voor tekstreconstructie en membership inference via embedding-analyse.
Embedding-inversieaanvallen
Technieken om invoertekst te reconstrueren uit embeddingvectoren: modelspecifieke inversiemethoden, privacy-implicaties en verdedigingen tegen embedding-inversie.
Membership inference via embeddings
Bepalen of specifieke data in de trainingsset van een embeddingmodel zat via afstandsgebaseerde inferentie, statistische toetsen en analyse van embedding-gedrag.
Embedding-inversieaanvallen (embeddingvectorbeveiliging)
Originele tekst reconstrueren uit embeddingvectoren met inversietechnieken.
Data-exfiltratie via vectordatabases
Technieken voor data-exfiltratie uit vectordatabases: embedding-inversie om documenten te reconstrueren, enumeratie-aanvallen en op overeenkomst gebaseerd dataharvesten.
Machine-unlearning-aanvallen en -verdedigingen
Het aanvallen en evalueren van machine-unlearning-technieken die worden gebruikt om gevoelige data uit getrainde modellen te verwijderen.
Beveiligingsonderzoek naar machine unlearning
Onderzoek naar aanvallen op methoden voor machine unlearning en de verificatie van het verwijderen van kennis.
AI-datagovernance en -beveiliging
Datagovernancepraktijken die specifiek zijn voor AI-systemen, waaronder herkomst van trainingsdata, toegangscontroles en bewaring.
Federated Learning Security
Beveiligingsaanvallen op federated-learning-systemen, waaronder modelvergiftiging, data-inferentie en exploitatie van Byzantijnse fouten.
GPU-geheugen side-channelaanvallen
Side-channelaanvallen die GPU-geheugentoewijzing, timing en elektromagnetische emanatie uitbuiten om gevoelige data te onttrekken aan AI-workloads.
Lab: extractie van trainingsdata op schaal
Extract memorized training data from language models using prefix-based extraction, divergence testing, and membership inference. Measure extraction rates and assess privacy risks.
Implementatie van embedding-inversieaanval
Implement embedding inversion to recover original text from vector database embeddings.
Simulatie: red team voor een spraakassistent
Red team engagement simulation targeting an AI voice assistant deployed in a smart home platform, covering audio-based prompt injection, wake word exploitation, and privacy exfiltration.
Dataharvesting via injection
Injectietechnieken gebruiken om trainingsdata, system prompts, gebruikersgegevens en andere gevoelige informatie uit LLM-toepassingen te extraheren.
Trainingsdata extraheren
Technieken om gememoriseerde trainingsdata, system prompts en privé-informatie uit LLM's te extraheren via gerichte queries en membership inference-aanvallen.
Embedding-inversie
Het herstellen van oorspronkelijke tekst uit embeddingvectoren, privacy-implicaties van opgeslagen embeddings, modelinversie-aanvallen op vector-databases en technieken voor analyse van de embedding-ruimte.
Vergiftiging van federated learning (training pipeline)
Architecturale kwetsbaarheden van federated learning: Byzantijnse aanvallen, modelvervanging, gradiëntmanipulatie en technieken om globale modellen te vergiftigen via kwaadwillende deelnemers.
Aanvallen op machine unlearning
Het uitbuiten van machine unlearning-processen: het herstellen van zogenaamd vergeten data, aanvallen op unlearning-verificatie, uitbuiting van gedeeltelijke unlearning, en de fundamentele grenzen van vergeten in neurale netwerken.
Beveiliging van methoden voor attributie van trainingsdata
Analyse van kwetsbaarheden in technieken voor attributie van trainingsdata, waaronder influence functions, membership inference en het traceren van dataherkomst, met implicaties voor privacy en beveiliging.
Pijplijn voor PII-redactie
Step-by-step walkthrough for building an automated PII detection and redaction pipeline for LLM outputs, covering regex-based detection, NER-based detection, presidio integration, redaction strategies, and compliance testing.