# instruction-tuning
2 artikelengetagd met “instruction-tuning”
Manipulatie van instruction tuning
Techniques for manipulating instruction-tuned models by crafting adversarial training examples that alter the model's instruction-following behavior.
fine-tuninginstruction-tuningmanipulationsafety
SFT-datavergiftiging & -injectie
Het vergiftigen van supervised-fine-tuning-datasets via manipulatie van instructie-responsparen, backdoor-triggers in SFT-data en het bepalen van de minimale drempel aan vergiftigde voorbeelden.
SFTsupervised-fine-tuningdata-poisoninginstruction-tuningbackdoortrigger