# instruction-following
3 artikelengetagd met “instruction-following”
Het volgen van instructies als aanvalsoppervlak
Waarom het instructievolgende vermogen van LLM's inherent een aanvalsoppervlak is.
foundationsinstruction-followingattack-surfacebehavior
Lab: prioriteit bij het volgen van instructies
Test how language models prioritize conflicting instructions from system prompts, user messages, and embedded directives to understand the instruction hierarchy.
labinstruction-followingpriorityconflicting-instructionsbeginnerhands-on
Lab: het volgen van instructies meten
Quantitatively measure instruction following compliance to identify where models prioritize competing instructions.
labsinstruction-followingmeasurementintermediate