# evasion

40 articlestagged with “evasion”

Defender for AI Bypass

Red team techniques for understanding and bypassing Microsoft Defender for AI: detection capabilities, alert analysis, bypass strategies, coverage gaps, and alert fatigue exploitation.

azuredefenderdetection-bypassalert-fatiguecoverage-gapsevasionblue-teamred-team

Expert

AI Code Review Bypass Techniques

Techniques for crafting code changes that evade AI-powered security review tools while introducing vulnerabilities or backdoors.

code-genreviewbypassevasion

Advanced

Monthly Competition: Stealth Operations

Monthly competition challenging participants to achieve objectives while evading detection by increasingly sophisticated monitoring systems.

communitycompetitionstealthevasion

Advanced

Data Deduplication Attacks

Exploiting and evading data deduplication processes used in training pipeline data cleaning to ensure poisoned samples survive preprocessing.

data-trainingdeduplicationpoisoningevasion

Advanced

Watermark & Fingerprint Evasion

Deep dive into detecting and removing output watermarks, degrading weight watermarks, evading model fingerprinting, building provenance-stripping pipelines, and understanding the legal landscape of model ownership verification.

watermarkingfingerprintingevasionprovenanceip-theftmodel-extraction

Advanced

Backdoor Trigger Design

Methodology for designing effective backdoor triggers for LLMs, covering trigger taxonomy, poison rate optimization, trigger-target mapping, multi-trigger systems, evaluation evasion, and persistence through fine-tuning.

backdoortrigger-designtrojantraining-attackspersistenceevasion

Expert

Training Data Watermark Attacks

Attacking and evading watermarking schemes designed to detect training data usage and enforce data licensing compliance.

data-trainingwatermarkdetectionevasion

Advanced

Input/Output Filtering Systems

Deep dive into regex, ML classifier, and embedding-based filters for both input scanning and output scanning, with systematic bypass techniques for each type.

input-filteringoutput-filteringregexml-classifierembeddingbypassevasion

Expert

Embedding Watermarking Attacks

Attacking and evading embedding watermarking schemes used for content tracking and intellectual property protection.

embeddingwatermarkingdetectionevasion

Advanced

Evaluation Evasion in Fine-Tuning

Crafting fine-tuned models that pass standard safety evaluations while containing hidden unsafe behaviors that activate under specific conditions.

fine-tuningevaluationevasionsafety-testing

Advanced

Adversarial ML: Core Concepts

History and fundamentals of adversarial machine learning — perturbation attacks, evasion vs poisoning, robustness — bridging classical adversarial ML to LLM-specific attacks.

adversarial-mlfundamentalsevasionpoisoningintermediate

Intermediate

AI Fraud Detection Evasion

Techniques for evading AI-powered fraud detection systems through adversarial transaction crafting.

industry-verticalsfinancefraud-detectionevasion

Advanced

Evading AI Fraud Detection

Techniques for evading AI-powered fraud detection systems including adversarial transaction crafting, concept drift exploitation, feedback loop manipulation, and ensemble evasion strategies.

fraud-detectionevasionadversarialtransactionsconcept-driftfinancial

Advanced

Semantic Injection Attacks

Meaning-preserving adversarial attacks that evade syntactic detection by encoding malicious intent in semantically equivalent but structurally different formulations.

semantic-injectionevasionparaphrasingmeaning-preservingdetection-bypass

Advanced

Defense-Aware Injection Design

Designing prompt injections that account for and evade known defensive mechanisms.

injection-researchdefense-awaredesignevasion

Advanced

Basic Classifier Evasion

Evade basic input/output classifiers using paraphrasing, synonym substitution, and formatting tricks.

labsclassifierevasionbeginner

Beginner

Lab: Defense Bypass Basics

Learn basic techniques to bypass simple LLM defenses including keyword filters, instruction reinforcement, and output validators using encoding, reformulation, and indirect approaches.

labdefense-bypassevasionfiltersbeginnerhands-on

Beginner

Classifier Gauntlet: 10-Stage Evasion

Bypass 10 progressively harder input classifiers using different evasion techniques at each stage.

labsctfclassifierevasion

Advanced

Lab: Azure Content Filter Evasion

Hands-on lab for mapping and testing Azure OpenAI Service content filtering categories, severity levels, and bypass techniques.

labcloudazurecontent-filterevasioncloud-ai

Intermediate

Lab: Chunking Exploitation

Hands-on lab for crafting documents that split across chunks in ways that hide malicious content from chunk-level filtering while maintaining attack effectiveness.

labragchunkingevasiondata-attacks

Intermediate

ML Classifier Evasion Lab

Develop payloads that evade machine learning-based input classifiers through adversarial text perturbation.

classifierintermediateevasionlablabs

Intermediate

Lab: Encoding Evasion Techniques

Hands-on lab using Base64, ROT13, Unicode normalization, and custom encoding schemes to evade input filters and safety classifiers in language model systems.

labencodingevasionobfuscationfilters

Intermediate

LLM Guard Evasion Techniques

Develop evasion techniques against LLM Guard input scanners and output detectors.

labsllm-guardevasionintermediate

Intermediate

Multimodal Defense Bypass Techniques

Techniques for bypassing safety filters that only analyze individual modalities.

multimodaldefense-bypasstechniquesevasion

Advanced

Multimodal Watermark Evasion

Techniques for evading and removing watermarks applied to AI-generated images, audio, and video content.

multimodalwatermarkevasion

Advanced

Language Switching

Exploiting language-specific gaps in safety training by switching to low-resource languages, mixing languages, or using transliteration to evade filters.

language-switchingmultilingualevasionlow-resourcered-teaming

Intermediate

Advanced Payload Obfuscation

Advanced obfuscation techniques for prompt injection payloads including encoding chains and semantic disguise.

prompt-injectionobfuscationpayloadevasion

Advanced

Payload Splitting

Breaking malicious instructions across multiple messages, variables, or data sources to evade single-point detection while the model reassembles the complete payload during processing.

prompt-injectionpayload-splittingfragmentationevasionred-teaming

Intermediate

Semantic Camouflage Attacks

Using semantic similarity and paraphrase techniques to disguise adversarial instructions as benign content while preserving attack effectiveness.

prompt-injectionsemanticcamouflageevasion

Advanced

Time-Based Injection Attacks

Attacks that exploit temporal aspects of model interaction including conversation history management, cache behavior, and session handling.

prompt-injectiontemporaltime-basedevasion

Advanced

Counter-Forensics for AI Attacks

Techniques for evading forensic analysis during and after AI red team operations, including log manipulation and behavioral normalization.

tradecraftcounter-forensicsevasionanti-analysis

Advanced

Evasion Techniques for AI Classifiers

Advanced techniques for evading input/output safety classifiers in LLM applications.

tradecraftevasionclassifierstechniques

Advanced

Encoding-Based Evasion

Using base64, ROT13, hexadecimal, Unicode, and other encoding schemes to evade input detection systems and bypass content filters in LLM applications.

prompt-injectionencodingbase64rot13unicodeevasionred-teamingintermediate

Intermediate

Encoding Chain Attack Walkthrough

Chain multiple encoding transformations to bypass input filters that only decode one layer of encoding.

walkthroughsencodingchain-attacksevasion

Intermediate

Payload Obfuscation Techniques

Methods for disguising prompt injection payloads through encoding, splitting, substitution, and other obfuscation techniques to bypass input filters and detection systems.

prompt-injectionobfuscationevasionpayload-craftingred-teamingintermediate

Intermediate

Regex Filter Bypass Walkthrough

Systematically bypass regex-based input filters using Unicode tricks, encoding, and pattern-specific evasion.

walkthroughsregexfilter-bypassevasion

Intermediate

Typography Injection in Images

Using rendered text with specific fonts, styles, and typographic techniques in images to inject prompts into vision-language models while evading detection.

multimodaltypographyprompt-injectionvisionevasion

Intermediate

Semantic Obfuscation Walkthrough

Walkthrough of semantically obfuscating adversarial payloads so they appear benign to both classifiers and humans.

walkthroughssemantic-obfuscationevasiontechnique

Advanced

Building Converter Pipelines for Payload Transformation in PyRIT

Intermediate walkthrough on using PyRIT's converter system to transform attack payloads through encoding, translation, paraphrasing, and other obfuscation techniques to evade input filters.

pyritconverterspayload-transformationevasionwalkthrough

Intermediate

Testing Prompt Injection Defenses with Rebuff

Walkthrough for using Rebuff to test and evaluate prompt injection detection capabilities, covering installation, detection pipeline analysis, adversarial evasion testing, custom rule development, and benchmarking detection accuracy.

rebuffprompt-injectiondetectiondefense-testingevasionwalkthrough

Intermediate