# in-context-learning
7 artikelengetagd met “in-context-learning”
Exploitatie van In-Context Learning
Het misbruiken van few-shot- en in-context learning-capaciteiten voor prompt-injectie, gedragsmodificatie en het kapen van taken.
Lab: few-shot-manipulatie-aanvallen
Craft fake few-shot examples that teach the model to bypass its safety training by demonstrating the desired adversarial behavior through fabricated conversation examples.
Few-shot-manipulatie
Vervaardigde in-context voorbeelden gebruiken om modelgedrag te sturen, waaronder many-shot jailbreaken, vergiftigde demonstraties en conditionering op basis van voorbeelden.
Many-shot jailbreaking
Power-law-schaling van in-context jailbreaks: waarom 5 shots falen maar 256 slagen, de grootte van het contextvenster als aanvalsoppervlak, en mitigaties tegen exploitatie van lange context.
Few-shot injection
Using crafted few-shot examples within user input to steer LLM behavior toward unintended outputs, exploiting in-context learning to override safety training.
Walkthrough: poisoning van few-shot-voorbeelden
Poison few-shot examples in prompts to establish behavioral patterns that override system instructions.
Many-shot jailbreaking (aanval-walkthrough)
Using large numbers of examples in a single prompt to overwhelm LLM safety training through in-context learning, exploiting long context windows to shift model behavior.