# unicode
9 artikelengetagd met “unicode”
Technieken om karaktercodering te omzeilen
Bypass input filters using Unicode normalization, homoglyph substitution, and mixed-script encoding.
Injectietechnieken met emoji en Unicode
Use emoji sequences and Unicode special characters to bypass text-based input filters.
Lab: Geavanceerde token-smuggling via Unicode-normalisatie
Buit normalisatieverschillen tussen invoervalidators en LLM-tokenizers uit om contentfilters te omzeilen en verborgen instructies te injecteren.
Lab: bypass-aanvallen via Unicode-normalisatie
Exploit Unicode normalization differences between input validation and model processing to smuggle injection payloads.
Technieken om encoding te omzeilen
Het gebruik van Base64, ROT13, Unicode-transformaties, hex-encoding en andere obfuscatiemethoden om filters voor prompt injection en safety classifiers te omzeilen, met behoud van de semantische betekenis.
Injectie via Unicode en homoglyphen
Inconsistenties in Unicode-normalisatie, homoglyph-substitutie en onzichtbare tekens benutten om onopvallende injection-payloads te construeren.
Ontwijking op basis van encoding
Using base64, ROT13, hexadecimal, Unicode, and other encoding schemes to evade input detection systems and bypass content filters in LLM applications.
Walkthrough van het omzeilen van Unicode-normalisatie
Step-by-step guide to exploiting Unicode normalization differences between input filters and model tokenizers.
Verdediging via Unicode-normalisatie
Step-by-step walkthrough for implementing Unicode normalization to prevent encoding-based prompt injection bypasses, covering homoglyph detection, invisible character stripping, bidirectional text handling, and normalization testing.