# extraction
25 artikelengetagd met “extraction”
Beoordeling van promptlekkage
Assessment of system prompt extraction techniques including direct probing, logprob analysis, and side-channel methods.
Casestudy: extractie van trainingsdata uit GPT
Analysis of the Carlini et al. work on extracting training data from ChatGPT in production.
Promptextractie uit codegeneratietools
Techniques for extracting system prompts, custom instructions, and proprietary configurations from AI code generation tools.
Extractie van trainingsdata uit codemodellen
Techniques for recovering proprietary code from code generation model weights — covering memorization detection, targeted extraction, membership inference, and defensive countermeasures.
Januari 2026: uitdaging voor extractie van system prompts
Extract system prompts from five increasingly defended chatbots, progressing from unprotected to heavily hardened configurations.
Aanvallen op knowledge distillation
Attacking knowledge distillation pipelines to transfer backdoors from teacher to student models or extract proprietary capabilities.
Memorisatiepatronen van modellen
Understanding when and why language models memorize training data, and techniques for detecting and exploiting memorization behavior.
Technieken voor PII-extractie
Techniques for extracting personally identifiable information from trained language models including prompt-based extraction, prefix attacks, targeted queries, and real-world examples.
Geavanceerde extractie van trainingsdata
Advanced techniques for extracting memorized training data from language models.
Technieken voor embedding-extractie
Methoden om de gewichten en het gedrag van embeddingmodellen te extraheren via API-toegang, waaronder dimensiereductie en reconstructie-aanvallen.
Lab: modelextractie van een veiligheidsclassifier
Extract the decision boundary of safety classifiers through systematic probing to craft maximally evasive payloads.
Lab: extractie van trainingsdata op schaal
Extract memorized training data from language models using prefix-based extraction, divergence testing, and membership inference. Measure extraction rates and assess privacy risks.
Extractie van trainingsdata uit productie-LLM's
Implement Carlini et al.'s techniques to extract memorized training data from production language model APIs.
Lab: grondbeginselen van prompt leaking
Learn to extract system prompts from chatbots using common leaking techniques including direct requests, indirect elicitation, and format manipulation.
Grondbeginselen van extractie van de systeemprompt
Learn to extract hidden system prompts from LLM applications using direct and indirect techniques.
Lab: extractie van system prompts
Hands-on techniques for extracting hidden system prompts from LLM-powered applications using direct asking, role-play, instruction replay, and other methods.
Lab: reconstructie van de system prompt
Use various techniques to systematically extract and reconstruct the full system prompt of an LLM application, combining direct, indirect, and incremental extraction methods.
Context Heist: kampioenschap system prompt-extractie
Extract system prompts from 10 progressively harder LLM applications using diverse techniques.
Lab: extractie van guardrail-regels
Systematically extract the rules and decision boundaries of guardrail systems through targeted probing.
Technieken voor diefstal van de systeemprompt
Uitgebreide technieken om verborgen systeemprompts te onttrekken aan LLM-applicaties in productie, van eenvoudige directe verzoeken tot geavanceerde indirecte methoden.
Extractie van de systeemprompt
Technieken om verborgen systeemprompts uit AI-applicaties te extraheren, waarmee safety-regels, tooldefinities, gedragsbeperkingen en gevoelige configuratie worden blootgelegd.
Technieken voor extractie van de systeemprompt
Catalogus van methoden voor extractie van de systeemprompt bij LLM-gestuurde applicaties: directe aanvallen, indirecte technieken, multi-turn-strategieën en defensieve ontwijking.
Technieken voor stealth-data-extractie
Stealthy technieken om gevoelige data uit AI-systemen te extraheren zonder alarmen te triggeren.
Walkthrough: geavanceerde prompt leaking
Advanced techniques for extracting system prompts including iterative reconstruction and side-channel methods.
Prompt leaking stap voor stap
Systematic approaches to extract system prompts from LLM applications, covering direct elicitation, indirect inference, differential analysis, and output-based reconstruction.