Grondslagen
Essentiële bouwstenen voor AI-redteaming: red team-methodologie, het AI-landschap, hoe LLM's werken, embeddings en vectorsystemen, AI-systeemarchitectuur en concepten uit adversarial machine learning.
Voordat je een AI-systeem effectief kunt aanvallen, moet je begrijpen hoe het werkt. Dit onderdeel biedt de technische en methodologische grondslagen die aan elk onderwerp in het curriculum ten grondslag liggen. Of je nu een traditionele beveiligingsachtergrond hebt en moet leren hoe transformers taal verwerken, of een ML-achtergrond hebt en een gestructureerde methodologie voor beveiligingsbeoordeling moet leren: deze grondslagen vullen de gaten.
Het materiaal hier is bewust praktisch. In plaats van uitputtende ML-theorie richt het zich op de aspecten van AI-systemen die beveiligingsrelevant gedrag veroorzaken: hoe tokenisatie injectie-aanvallen beïnvloedt, hoe attention-mechanismen misbruikt kunnen worden, hoe embeddingruimtes semantische manipulatie mogelijk maken, en hoe deploymentarchitecturen vertrouwensgrenzen creëren. Elk concept wordt gepresenteerd door de bril van wat een redteamer moet weten om zijn werk goed te doen.
De kennisstack
AI-redteaming bevindt zich op het snijvlak van machine learning, softwarebeveiliging en adversarial denken. Het grondslagen-onderdeel is zo opgezet dat het begrip vanaf de basis opbouwt.
Methodologie legt de gestructureerde aanpak van AI-beveiligingsbeoordeling vast. Dit omvat aanvalstaxonomieën die kwetsbaarheden classificeren op type en impact, dreigingsmodelleringskaders die zijn aangepast voor AI-systemen, en de ethische en juridische guardrails die verantwoord redteamen definiëren. Zonder methodologie wordt testen ad hoc -- je vindt dan misschien losse kwetsbaarheden, maar mist systemische zwaktes.
Het AI-landschap biedt oriëntatie binnen het bredere ecosysteem. Inzicht in de verschillen tussen open en gesloten modellen, de grote API-aanbieders en hun beveiligingsmodellen, deploymentpatronen van edge tot cloud, en de verschillende modeltypes in productie geeft je de context die je nodig hebt om opdrachten af te bakenen en te bepalen wat je eigenlijk test.
Hoe LLM's werken behandelt de technische binnenkant die beveiligingsrelevant gedrag aanstuurt. De transformer-architectuur legt uit hoe attention-mechanismen informatie tussen tokens routeren. Tokenisatie laat zien waarom bepaalde encodingtrucs filters omzeilen. Inzicht in de trainingspijplijn verklaart waar veiligheidsgedrag wordt ingebracht en hoe het ondermijnd kan worden. De mechanica van inference en decoding verklaart waarom temperatuur, sampling en logitverwerking de slagingskans van aanvallen beïnvloeden.
Embeddings en vectorsystemen zijn essentieel om RAG-architecturen en semantische gelijkenis te begrijpen. Als je weet hoe documenten in vectorruimtes worden geëmbed en op basis van gelijkenis worden opgehaald, kun je redeneren over hoe je retrieval kunt manipuleren, kennisbanken kunt vergiftigen en de kloof tussen semantische gelijkenis en semantische intentie kunt misbruiken.
AI-systeemarchitectuur brengt de componenten van AI-deployments in productie in kaart: API-lagen, orchestratieframeworks, toolintegraties, agentpatronen en de vertrouwensgrenzen daartussen. Dit architecturale inzicht stelt je in staat aanvalsoppervlakken te identificeren die niet zichtbaar zijn vanuit de gebruikersinterface alleen.
Concepten uit adversarial ML verbinden traditionele adversarial machine learning met moderne LLM-beveiliging. Gradient-gebaseerde aanvallen, dreigingsmodellen en robuustheidsconcepten uit de academische literatuur over adversarial ML vormen het theoretische fundament voor veel praktische aanvallen op gedeployde systemen.
Wat je in dit onderdeel leert
- Red team-methodologie -- Gestructureerde aanpakken voor AI-beveiligingsbeoordeling, inclusief aanvalstaxonomieën, basis van dreigingsmodellering, ethische richtlijnen en juridische overwegingen
- Het AI-landschap -- Overzicht van modeltypes, deploymentpatronen, het API-ecosysteem en het onderscheid tussen open en gesloten modellen
- Hoe LLM's werken -- De transformer-architectuur, tokenisatie en de beveiligingsimplicaties daarvan, de trainingspijplijn van pre-training tot en met alignment, de mechanica van inference en decoding, en scaling en emergentie
- Embeddings & vectorsystemen -- Hoe embeddings betekenis coderen, semantische gelijkenis en de manipulatie ervan, en de architectuur en retrieval-mechanica van RAG
- AI-systeemarchitectuur -- Deploymentpatronen, de anatomie van een API, agentarchitecturen en de vertrouwensgrenzen die aanvalsoppervlakken bepalen
- Concepten uit adversarial ML -- Dreigingsmodellen voor ML-systemen, gradient-gebaseerde aanvallen en robuustheidsconcepten die de moderne AI-beveiliging vormgeven
Voorkennis
Dit onderdeel is bedoeld als startpunt van het curriculum. Eerdere ervaring met AI of ML is niet vereist, al helpt de volgende achtergrond je sneller door het materiaal te komen:
- Programmeerbasis -- Comfortabel Python-code lezen en API-interacties begrijpen
- Basisbeveiligingsconcepten -- Vertrouwdheid met kwetsbaarheidsklassen, dreigingsmodellering en de aanvallersmindset uit de traditionele cybersecurity
- Algemene technische geletterdheid -- Begrip van HTTP, JSON, REST-API's en client-serverarchitecturen