# techniques
21 artikelengetagd met “techniques”
Threat hunting-technieken voor AI
Proactieve threat hunting-technieken voor het identificeren van lopende aanvallen tegen AI-systemen.
Technieken voor aanvalsattributie
Technieken voor het toeschrijven van AI-aanvallen aan specifieke actoren, waaronder gedragsanalyse, infrastructuurtracking en techniek-fingerprinting.
LLM-loganalysetechnieken
Technieken voor het analyseren van LLM-applicatielogs om aanvalspatronen en gecompromitteerde sessies te identificeren.
Technieken voor misbruik van codeerassistenten
Techniques for exploiting AI code assistants to generate insecure code or leak repository information.
Februari 2026: jailbreak-innovatie-uitdaging
Develop novel jailbreak techniques against hardened language models and document them with reproducibility evidence. Judged on novelty, reliability, and transferability.
Technieken voor embedding-poisoning
Technieken om embeddingruimtes te vergiftigen en zo retrieval en similarity search te manipuleren.
Aanvalstechnieken voor LoRA
Exploiting Low-Rank Adaptation fine-tuning for safety alignment removal and backdoor insertion.
Lab: overzicht van injection-technieken
Survey and test ten fundamental prompt injection techniques against a local LLM, measuring effectiveness and cataloging behavioral patterns for each approach.
Lab: basale jailbreak-technieken
Hands-on exploration of jailbreak techniques including role-play, DAN-style prompts, and academic framing against multiple models.
Lab: eenvoudige technieken voor payload-encoding
Practice encoding injection payloads using Base64, hex, URL encoding, and Unicode to bypass basic input filters.
Lab: technieken om guardrails te omzeilen
Practice guardrail bypass techniques against NeMo Guardrails, LLM Guard, and custom classifier-based defenses.
Lab voor technieken van promptlekkage
Practice multiple system prompt extraction techniques and measure their effectiveness across different targets.
Op afbeeldingen gebaseerde prompt-injectietechnieken
Technieken voor het inbedden van vijandige prompts in afbeeldingen die door vision-language-modellen worden verwerkt.
Technieken voor het omzeilen van multimodale verdediging
Technieken voor het omzeilen van veiligheidsfilters die alleen individuele modaliteiten analyseren.
Injection-technieken in competitiestijl
Injection-technieken die vaak worden ingezet bij AI-redteamingcompetities en CTF-uitdagingen.
Universele jailbreak-technieken
Analyse van jailbreak-technieken die overdraagbaar zijn tussen meerdere modellen en providers.
Catalogus van jailbreak-technieken
Uitgebreide catalogus van jailbreak-technieken met effectiviteitsbeoordelingen, opmerkingen over modelcompatibiliteit en evolutiegeschiedenis.
Prompt injection-cheatsheet
Snelle referentie voor prompt injection-technieken, georganiseerd per categorie, met voorbeeld-payloads en defensieve overwegingen voor elke techniek.
Ontwijkingstechnieken voor AI-classifiers
Geavanceerde technieken om input-/output-safety-classifiers in LLM-applicaties te omzeilen.
Workflow voor het uitvoeren van aanvallen
Step-by-step workflow for executing AI red team attacks: selecting techniques from recon findings, building attack chains, documenting findings in real-time, managing evidence, and knowing when to escalate or stop.
MITRE ATLAS gebruiken voor het in kaart brengen van AI-aanvallen
Walkthrough for mapping AI red team activities and findings to the MITRE ATLAS framework, covering tactic and technique identification, attack chain construction, and navigator visualization.