# internals
6 artikelengetagd met “internals”
Interne werking van LLM's
Diepgaande technische verkenning van de interne mechanismen van LLM's voor exploit-ontwikkeling, met onder meer activatieanalyse, primitives om alignment te omzeilen, en misbruik van de embeddingruimte.
Interne werking van LLM's voor exploitontwikkelaars
Transformer-architectuur, interne werking van tokenizers, logit-pipelines en trust boundaries vanuit een offensief beveiligingsperspectief.
Representation probing voor het ontdekken van kwetsbaarheden
Probe model internal representations to discover exploitable features and latent vulnerability patterns.
Misbruik van attention-mechanismen
Hoe het self-attention-mechanisme in transformers kan worden ingezet om modelgedrag te sturen, informatie-routing te kapen en veiligheidsinstructies te omzeilen.
Aanvallen op de embeddingruimte
Technieken om de embeddinglaag van LLM's aan te vallen, waaronder adversarial verstoringen, embedding-inversie en manipulatie van de semantische ruimte.
Interne werking van LLM's en exploit-primitieven
Een overzicht van de architectuur van grote taalmodellen vanuit het perspectief van een securityonderzoeker, met de belangrijkste componenten die misbruikbare aanvalsoppervlakken creëren.