# instruction
3 artikelengetagd met “instruction”
Veiligheid omzeilen via instruction tuning
Using instruction tuning to selectively bypass safety mechanisms while maintaining model capability.
instructionfinesafetybypasstuning
Misbruik van de instructiehiërarchie
Het misbruiken van ambiguïteiten in instructieprioriteitshiërarchieën bij verschillende modelaanbieders.
hierarchyinstructionexploitationinjectionprompt
Manipulatie van instruction-tuning-data
Het manipuleren van instruction-tuning-datasets om specifiek gedrag in het resulterende model in te bedden.
instructionpipelinetuningmanipulationtraining