Tokenizer-manipulatie en aangepaste vocabulaires
BPE-trainingsdata aanvallen om de opbouw van het vocabulaire te beïnvloeden, speciale tokens invoegen, merge-regels manipuleren en aangepaste tokenizer-backdoors creëren.
tokenizerBPEvocabularymerge-rulestoken-manipulationspecial-tokens