Aanvallen op inferentieoptimalisatie
Aanvallen op speculatieve decodering, kwetsbaarheden in batching, exploitatie van continuous batching, en hoe optimalisatie voor snelheid beveiligingsgaten creëert in LLM-inferentie.
inferencespeculative-decodingbatchingcontinuous-batchingoptimizationside-channel