AI-redteaming-onderwerpen

36 categorieën, 3112 artikelen — blader door het volledige AI-redteaming-curriculum.

Impactcategorieën

Gevolgen van AI-aanvallen in de praktijk — desinformatie, generatie van schadelijke content en systemische risicobeoordeling.

8 artikelen

2 Beginner5 Gemiddeld1 Gevorderd

Overzicht van community-uitdagingen

Maandelijkse AI-redteaming-uitdagingen — verdien punten, deel resultaten en ontwikkel je vaardigheden samen met de community.

58 artikelen

8 Beginner28 Gemiddeld19 Gevorderd3 Expert

Agentic exploitatie

Geavanceerd agentic misbruik — complexe multi-agent-aanvalsketens en misbruik van tool-gebruik.

150 artikelen

1 Beginner55 Gemiddeld80 Gevorderd14 Expert

AI Infrastructure Security

RCE via modelserialisatie, misbruik van AI-infrastructuur, patronen voor applicatiebeveiliging.

85 artikelen

3 Beginner38 Gemiddeld36 Gevorderd8 Expert

AI-forensics & Incident response

Forensisch onderzoek en incidentrespons voor AI-systemen — bewijsverzameling, attributie en containment.

71 artikelen

4 Beginner34 Gemiddeld30 Gevorderd3 Expert

AI-redteaming methodologie

LLM-fingerprinting, extractie van system prompts, AI-specifieke dreigingsmodellering.

11 artikelen

2 Beginner8 Gemiddeld1 Gevorderd

Assessments en verificatie van vaardigheden

Assessmentsuite om kennis van AI-redteaming te valideren — sectie-assessments, oefentoetsen en vaardigheidsverificatie.

214 artikelen

9 Beginner111 Gemiddeld89 Gevorderd5 Expert

Beroepspraktijk

Professionele vaardigheden voor AI-redteamers — operationeel beheer, rapportage en omgang met klanten.

63 artikelen

13 Beginner44 Gemiddeld6 Gevorderd

Beveiliging van cloud-AI

Cloud-AI-beveiliging voor redteamers — shared responsibility-modellen, aanvalsoppervlakken en cloud-native misbruik van AI.

62 artikelen

36 Gemiddeld24 Gevorderd2 Expert

Beveiliging van codegeneratie

Kwetsbaarheden in AI-codeerassistenten — poisoning van suggesties, aanvallen op trainingsdata en misbruik van codegeneratie.

63 artikelen

3 Beginner35 Gemiddeld23 Gevorderd2 Expert

Beveiliging van de trainingspijplijn

Beveiliging van de trainingspipeline — aanvallen tijdens pre-training, misbruik van fine-tuning, omzeilen van alignment en manipulatie van RLHF.

78 artikelen

1 Beginner5 Gemiddeld46 Gevorderd26 Expert

Beveiliging van fine-tuning

Fine-tuning als aanvalsvector — verwijderen van safety alignment, datavergiftiging via fine-tuning-API’s.

45 artikelen

15 Gemiddeld29 Gevorderd1 Expert

Casestudy's

AI-beveiligingsincidenten uit de praktijk, domeinspecifieke casestudy’s en beveiligingsanalyse op platformniveau.

73 artikelen

6 Beginner40 Gemiddeld27 Gevorderd

Data- en trainingsbeveiliging

Data- en trainingsaanvallen — geavanceerde technieken voor poisoning, extractie en manipulatie.

53 artikelen

1 Beginner10 Gemiddeld27 Gevorderd15 Expert

Diepe duiken per model

Modelspecifieke beveiligingsanalyse — kwetsbaarheden op architectuurniveau bij GPT, Claude, Llama en meer.

47 artikelen

14 Gemiddeld31 Gevorderd2 Expert

Embedding- en vectorbeveiliging

Aanvalsoppervlakken van embeddings — beveiliging van vectordatabases, embeddinginjectie en misbruik van similariteitszoekopdrachten.

44 artikelen

15 Gemiddeld29 Gevorderd

Frontier Research

Toonaangevend AI-beveiligingsonderzoek — aanvallen op reasoning-modellen, computationele exploits en opkomende dreigingsvectoren.

114 artikelen

1 Beginner2 Gemiddeld61 Gevorderd50 Expert

Governance & Compliance

AI-governanceframeworks, juridische en ethische overwegingen, evaluatiebenchmarking en compliancevereisten.

92 artikelen

3 Beginner73 Gemiddeld15 Gevorderd1 Expert

Grondslagen

Essentiële bouwstenen voor AI-redteaming — methodologie, AI-landschap, LLM-grondbeginselen en dreigingsmodellering.

44 artikelen

26 Beginner16 Gemiddeld2 Gevorderd

Injection-onderzoek

Injectieonderzoek en -automatisering — systematische benaderingen om nieuwe injectievectoren te ontdekken.

38 artikelen

1 Beginner5 Gemiddeld24 Gevorderd8 Expert

Interne werking van LLM's

Geavanceerde interne werking van LLM’s — verdiepingen in modelarchitectuur en exploit-primitieven.

13 artikelen

1 Beginner1 Gemiddeld3 Gevorderd8 Expert

Interne werking van LLM's en exploit-primitieven

Transformer-architectuur, misbruik van de tokenizer, omzeilen van alignment, embeddingaanvallen.

8 artikelen

1 Beginner1 Gemiddeld6 Gevorderd

Inzicht in AI-verdedigingen

AI-verdedigingen begrijpen vanuit het perspectief van de aanvaller — verdedigingscategorieën en strategieën om ze te omzeilen.

8 artikelen

3 Beginner5 Gemiddeld

Labs en hands-on oefenen

Praktische laboefeningen van beginner tot expert — CTF-uitdagingen en praktische AI-redteaming-oefeningen.

622 artikelen

156 Beginner186 Gemiddeld193 Gevorderd87 Expert

LLMOps-beveiliging

Beveiliging over de hele LLMOps-levenscyclus — datavoorbereiding, experiment tracking, deployment en monitoring.

47 artikelen

27 Gemiddeld20 Gevorderd

Methodologie voor een volledige opdracht

End-to-end methodologie voor red team-opdrachten, rapportage en remediatie.

56 artikelen

10 Gemiddeld31 Gevorderd15 Expert

Misbruik van agents en agentic systemen

Aanvallen op AI-agents, misbruik van multi-agent-/A2A-protocollen, aanvallen op het MCP-tooloppervlak.

26 artikelen

1 Beginner13 Gemiddeld11 Gevorderd1 Expert

Multimodale beveiliging

Multimodale AI-beveiliging — aanvallen op beeld-, audio-, video- en cross-modale verwerking in AI-systemen.

75 artikelen

1 Beginner21 Gemiddeld42 Gevorderd11 Expert

Overzicht: ontwikkeling van AI-exploits

Op maat gemaakte adversarial tools, red team C2-frameworks, continue geautomatiseerde redteaming.

44 artikelen

1 Beginner21 Gemiddeld17 Gevorderd5 Expert

Prompt injection en jailbreaks

Geavanceerde injectietechnieken, geautomatiseerd jailbreak-onderzoek, multimodale aanvalsvectoren.

56 artikelen

2 Beginner25 Gemiddeld28 Gevorderd1 Expert

RAG-, data- en trainingsaanvallen

RAG-pipeline-poisoning, aanvallen op trainingsdata, modelextractie en diefstal van intellectueel eigendom.

9 artikelen

1 Beginner2 Gemiddeld6 Gevorderd

Referenties en snelle naslag

Naslagwerken en cheat sheets — beknopt referentiemateriaal voor AI-redteamers.

43 artikelen

16 Beginner27 Gemiddeld

Sectoren: AI-beveiliging per sector

Sectorspecifieke AI-beveiligingsuitdagingen — redteaming voor zorg, financiën, juridisch en kritieke infrastructuur.

105 artikelen

66 Gemiddeld39 Gevorderd

Tradecraft

Geavanceerde tradecraft — operationele technieken voor AI red team-opdrachten.

38 artikelen

1 Beginner18 Gemiddeld15 Gevorderd4 Expert

Verdediging & mitigatie

Defensieve strategieën voor AI-systemen — guardrails-architectuur, monitoring, observability en contentfiltering.

89 artikelen

1 Beginner50 Gemiddeld33 Gevorderd5 Expert

Walkthroughs

Stapsgewijze begeleide walkthroughs — red team-tools, opdrachtmethodologie en handleidingen voor het implementeren van verdediging.

460 artikelen

21 Beginner271 Gemiddeld159 Gevorderd9 Expert