# transformers

7 artikelengetagd met “transformers”

Analyse van attention-patronen voor beveiliging

Attention maps gebruiken om modelgedrag te begrijpen en te misbruiken, beveiligingsrelevante attention-patronen herkennen en de mechanica van attention inzetten voor red team-operaties.

attentiontransformersinterpretabilityattention-patternssecurity

Gevorderd

Interne werking van LLM's voor exploitontwikkelaars

Transformer-architectuur, interne werking van tokenizers, logit-pipelines en trust boundaries vanuit een offensief beveiligingsperspectief.

transformerstokenizersinternalsexploit-primitivescontext-window

Expert

Misbruik van attention-mechanismen

Hoe het self-attention-mechanisme in transformers kan worden ingezet om modelgedrag te sturen, informatie-routing te kapen en veiligheidsinstructies te omzeilen.

attentiontransformersinternalsexploit-primitivesinformation-routing

Gevorderd

Interne werking van LLM's en exploit-primitieven

Een overzicht van de architectuur van grote taalmodellen vanuit het perspectief van een securityonderzoeker, met de belangrijkste componenten die misbruikbare aanvalsoppervlakken creëren.

llmtransformersinternalsexploit-primitivesarchitecture

Beginner

Lab: Gequantiseerde modellen exploiteren

Praktijklab dat slagingskansen van aanvallen vergelijkt over quantisatieniveaus: jailbreaks testen op FP16 vs INT8 vs INT4, veiligheidsdegradatie meten, en quantisatiebewuste exploits ontwerpen.

labquantizationhands-onjailbreaksafety-testingtransformers

Gevorderd

Lab: een trainingsdataset vergiftigen

Praktisch lab dat datasetvergiftiging en fine-tuning demonstreert om gedragsverandering te tonen, met stapsgewijze Python-code, meting van de backdoor-trigger en troubleshooting-richtlijnen.

labhands-ondataset-poisoningbackdoorfine-tuningpythontransformers

Gevorderd

Hugging Face Hub Red Team-walkthrough

Walkthrough voor het beoordelen van AI-modellen op Hugging Face Hub: beveiligingsassessment van modellen, scannen op kwaadaardige modellen, testen met de Transformers-library, en evaluatie van Spaces-applicaties.

huggingfacemodel-hubtransformersmalicious-modelssupply-chainwalkthrough

Beginner