# internals

6 artikelengetagd met “internals”

Interne werking van LLM's

Diepgaande technische verkenning van de interne mechanismen van LLM's voor exploit-ontwikkeling, met onder meer activatieanalyse, primitives om alignment te omzeilen, en misbruik van de embeddingruimte.

internalsactivationsalignmentembeddingsmechanistic-interpretabilityexploit-development

Beginner

Interne werking van LLM's voor exploitontwikkelaars

Transformer-architectuur, interne werking van tokenizers, logit-pipelines en trust boundaries vanuit een offensief beveiligingsperspectief.

transformerstokenizersinternalsexploit-primitivescontext-window

Expert

Representation probing voor het ontdekken van kwetsbaarheden

Probe model internal representations to discover exploitable features and latent vulnerability patterns.

labsrepresentation-probinginternalsadvanced

Gevorderd

Misbruik van attention-mechanismen

Hoe het self-attention-mechanisme in transformers kan worden ingezet om modelgedrag te sturen, informatie-routing te kapen en veiligheidsinstructies te omzeilen.

attentiontransformersinternalsexploit-primitivesinformation-routing

Gevorderd

Aanvallen op de embeddingruimte

Technieken om de embeddinglaag van LLM's aan te vallen, waaronder adversarial verstoringen, embedding-inversie en manipulatie van de semantische ruimte.

embeddingsadversarialvector-spaceinternalsexploit-primitives

Gevorderd

Interne werking van LLM's en exploit-primitieven

Een overzicht van de architectuur van grote taalmodellen vanuit het perspectief van een securityonderzoeker, met de belangrijkste componenten die misbruikbare aanvalsoppervlakken creëren.

llmtransformersinternalsexploit-primitivesarchitecture

Beginner