# transformers
7 artikelengetagd met “transformers”
Analyse van attention-patronen voor beveiliging
Attention maps gebruiken om modelgedrag te begrijpen en te misbruiken, beveiligingsrelevante attention-patronen herkennen en de mechanica van attention inzetten voor red team-operaties.
Interne werking van LLM's voor exploitontwikkelaars
Transformer-architectuur, interne werking van tokenizers, logit-pipelines en trust boundaries vanuit een offensief beveiligingsperspectief.
Misbruik van attention-mechanismen
Hoe het self-attention-mechanisme in transformers kan worden ingezet om modelgedrag te sturen, informatie-routing te kapen en veiligheidsinstructies te omzeilen.
Interne werking van LLM's en exploit-primitieven
Een overzicht van de architectuur van grote taalmodellen vanuit het perspectief van een securityonderzoeker, met de belangrijkste componenten die misbruikbare aanvalsoppervlakken creëren.
Lab: Gequantiseerde modellen exploiteren
Praktijklab dat slagingskansen van aanvallen vergelijkt over quantisatieniveaus: jailbreaks testen op FP16 vs INT8 vs INT4, veiligheidsdegradatie meten, en quantisatiebewuste exploits ontwerpen.
Lab: een trainingsdataset vergiftigen
Praktisch lab dat datasetvergiftiging en fine-tuning demonstreert om gedragsverandering te tonen, met stapsgewijze Python-code, meting van de backdoor-trigger en troubleshooting-richtlijnen.
Hugging Face Hub Red Team-walkthrough
Walkthrough voor het beoordelen van AI-modellen op Hugging Face Hub: beveiligingsassessment van modellen, scannen op kwaadaardige modellen, testen met de Transformers-library, en evaluatie van Spaces-applicaties.